РГБ собирает базу для ИИ на основе отечественной литературы - IT Speaker, новости информационных технологий

РГБ собирает базу для ИИ на основе отечественной литературы

Редакция

16:00 / 04 сентября 2025

Российская государственная библиотека (РГБ, она же «Ленинка») работает над собранием обширного корпуса текстов отечественной литературы для разработки нейросети, способной генерировать разнообразные смыслы.

Фотография unsplash

Генеральный директор «Ленинки» Вадим Дуда заявил, что креативные индустрии привносят в экономику порядка 8-10 новых триллионов рублей в год. Его слова публикует ТАСС.

«Это достаточно большой рынок интеллектуальных прав. Но если это интеллектуальные права – значит там должно содержаться много смыслов нужных наших стране. В частности, должна идти речь о суверенитете и уважении к своей истории. Я думаю, что всем понадобится доступ к огромному количеству правильно обработанного контента. Как мне кажется, одна из важнейших задач, которая перед нами стоит – чтобы книги были внедрены в эту новую экономику», – подчеркнул Дуда.

Для этого, по мнению гендиректора РГБ, необходимо создавать полный корпус отечественных книг. Однако задача является трудновыполнимой, в частности, из-за наличия огромного количества переизданий.

«Как выделить огромный корпус произведений, который нужно дальше закрутить в некую метавселенную, нейросеть, из которой мы бы доставили более точные и емкие смыслы? Мне кажется, вызов примерно в этом – нам необходимо создать такой корпус смыслов, состоящих из нашей литературы. Стратегия "Ленинки" примерно в этом и заключается», – подытожил гендиректор «Ленинки».

В конце августа группа хакеров под название LunaLock взломала арт-сайт Artists&Clients, разместив на нем сообщение с угрозой. Злоумышленники намерены передать работы художников ИИ-компаниям, чтобы эти картины оказались в датасетах для обучения нейросетей. 

Поделиться новостью