DeepSeek представил ИИ для распознавания документов - IT Speaker, новости информационных технологий

DeepSeek представил ИИ для распознавания документов

Редакция

19:00 / 20 октября 2025

Разработчики DeepSeek выпустили новую открытую модель для распознавания документов – DeepSeek-OCR. Она отличается от аналогов тем, что ИИ не просто извлекает текст со страниц, а сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к рисункам.

Фотография freepik

Отметим, что результат можно получить в формате Markdown, который подходит для индексации и последующей работы нейросетей. DeepSeek-OCR распространяется под лицензией MIT и опубликована на платформе Hugging Face.

Также данная модель примечательна «оптическим сжатием контекста». Иными словами, ИИ не пересказывает каждую мелочь со страницы, а выжимает из нее только нужное: текст и смысловую структуру. Это сокращает объем данных в среднем в десять-двадцать раз и напрямую снижает стоимость обработки: чем меньше токенов, тем дешевле и быстрее работает любая последующая языковая модель.

Более того, DeepSeek-OCR использует так называемые визуальные токены – условные «взгляды» на части изображения. Даже при небольшом бюджете (64-100 токенов) точность распознавания держится на уровне 97-99%. Если страница слишком сложная, активируется режим Gundam: документ автоматически делится на отдельные фрагменты, и трудные области анализируются один за другим, без ограничений общей скорости.

Разработчики из команды Deepseek создали новую методику для самообучения моделей ИИ. Она позволяет ИИ самостоятельно осваивать новые навыки и знания без подсказок со стороны человека.

Вас может заинтересовать: 

Обучение модели R1 от Deepseek стоило $294 тысяч

Поделиться новостью