ИИ научился распознавать рукописное слово - IT Speaker, новости информационных технологий

ИИ научился распознавать рукописное слово

Редакция

16:20 / 21 марта 2025

Российские ученые обучили искусственный интеллект понимать рукописное слово «шиншилла». Такой навык позволит совершенствовать системы распознавания документов, рассказали «РИА Новости» в Smart Engines. 

Фотография unsplash

«Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как “шиншилла”, без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями», – сказали в компании. 

Слово «шиншилла» было выбрано из-за его сложности. Это объясняется тем, что при неразборчивом почерке строчные формы букв «ш», «л», «и» становятся практически неразличимы. 

Для того, чтобы нейросеть «Да Винчи» распознавала слово, разработчики обучили ее на 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. Это позволило сократить риск галлюцинаций ИИ.

«Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как “шиншилла”, но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка», – добавил Арлазаров. 

Ранее стало известно, что ИИ начали применять для подделки человеческого почерка. Технология на основе ИИ может всего из нескольких абзацев письменного текста сымитировать любой почерк человека. Ученые опасаются, что данная разработка будет использована во вред.


Поделиться новостью