Появилась поисковая система по древнерусским рукописям - IT Speaker, новости информационных технологий

Появилась поисковая система по древнерусским рукописям

Редакция

16:45 / 29 мая 2024

Специалисты из НИЯУ МИФИ и Института русского языка им. В.В. Виноградова запустили программный комплекс, позволяющий производить поиск по текстам, созданным на рукописном старославянском языке. Данный проект работает на базе искусственного интеллекта (ИИ).

Фотография unsplash

Итоговый продукт получил название «Рукописное наследие Древней Руси». По словам руководителя проекта, доцента кафедры кибернетики НИЯУ МИФИ Дмитрия Демидова запросы на ресурсе оформляются как в обычных интернет‑поисковиках. В поисковую базу включены оцифрованные рукописи из российских библиотек и музеев. На текущий момент база состоит из 245 объектов литературы, или миней. 

Минеи представляют собой наиболее распространенный вид древнерусских книг. В этих книгах повторяются одни и те же сюжеты, однако изучение и сравнение похожих текстов даст возможность понять, при каких обстоятельствах происходили изменения в нашем языке, культуре и мировосприятии. Например, можно увидеть, как по‑разному трактуется одна и та же история в разные эпохи. Или как изменяется значение слов с течением времени. Объем минеи составляет 500 страниц. 

Ученые отметили, что обработка древних текстов состоит из нескольких этапов. В первую очередь идет сегментирование страницы с вычленением отдельных элементов и символов. Дальше происходит классификация объектов и обучение нейросети. При обучении нейросети возникает ряд трудностей. Часть из них связана с различием в начертании одинаковых знаков в разных рукописях, а часть — с особенностями морфологии и синтаксиса старославянского языка. 

Ранее команда ученых из Университета Мартина Лютера в Галле-Виттенберге (MLU), Университета Иоганна Гутенберга в Майнце и Университета прикладных наук разработала программное обеспечение (ПО) на базе ИИ, способное расшифровать древние клинописные тексты на глиняных табличках.

Поделиться новостью