Что происходит с нейросетями в России: уже неплохо, но хотелось бы лучше - IT Speaker, новости информационных технологий

Что происходит с нейросетями в России: уже неплохо, но хотелось бы лучше

Виталий Волнянский

10:30 / 21 июля 2023

Виталий Волнянский

Руководитель практики технологических решений ЕАЕ-Консалт

Мировой успех ChatGPT, MidJourney, Stable Diffusion и других генеративных нейросетей вызывает вопрос о том, как обстоят дела с развитием алгоритмов искусственного интеллекта в России. Особенно учитывая растущую потребность в импортозамещении, ограничения, введенные для использования крупнейших генеративных продуктов для россиян, и бесспорную перспективность этих технологий. Руководитель практики технологических решений ЕАЕ-Консалт Виталий Волнянский попробовал проанализировать состояние направления на примере нескольких известных российских продуктов, оценить дальнейшие перспективы, а также сравнить, где это возможно, с зарубежными аналогами.  

История вопроса 

Еще советские ученые Алексей Ивахненко, Михаил Шлезингер, Александр Галушкин успешно занимались созданием нейросетей. Был даже короткий период в начале 1970-х, когда советские коннекционисты, так называлась кибернетическая научная школа пионеров самообучающихся нейронных сетей, опережали коллег на Западе. Между тем, небольшие бюджеты исследований и последующий распад СССР не только похоронили исследования в этой области, но сделали их не слишком востребованными и масштабными.  

В России продолжали экспериментировать с распознаванием образов, генерацией изображений и текста, но для прорывов было необходимо финансирование и большие объемы данных. Когда появились первые признаки того, что нейросети близки к успешному коммерческому применению, эстафету по их созданию в России приняли ИТ-гиганты, такие как «Яндекс», крупные банки, включая постепенно превращающийся в финтех-организацию «Сбер», а также продуктовые компании с сильной технической экспертизой, например, Sistemma. В процессе становления, повторяя процессы, происходившие в этой отрасли за рубежом, в создании нейросетей в России выросло четыре крупных направления: 

● Генеративные нейрочаты-ассистенты (как ChatGPT);

● Генераторы изображений из текстовых запросов (как MidJourney);

● Сервисные нейросети (голосовые и текстовые помощники для общения с клиентами);

● Специализированные нейросети для узкоспециальных задач, фиксация и распознавание номеров авто, фиксация и поиск лиц на видео, определение параметров на физическом оборудовании, распознавание и анализ аварийных ситуаций на опасных производствах и т.п. 

Остановимся на каждом направлении подробнее. 

Нейросети «Яндекса»

Решения удобно размещены в облаке, но не имеют возможности «приземлятся». «Яндекс» можно назвать одним из флагманов российской разработки генерирующих нейросетей, компания добилась заметных успехов. 

Яндекс GPT 

Общение с этим чат-ботом у многих оставляет тягостное впечатление, особенно у тех, кто раньше имел дело с ChatGPT и даже с каким-нибудь Lexii.ai. Поначалу даже закрадывается впечатление, что отечественный чат-бот «туповат». Протестировав его некоторое время, становится понятно, что дело не в проблемах модели, количестве параметров или недостатке данных, а в цензурных ограничений. «Яндекс» очень щепетильно относится к тому, чтобы не задеть пользователя и не выдать ту информацию, которая может навредить или стать основой для противоправных действий. 

Ощущается, что для «Яндекса» крайне важно снизить репутационные риски, что в итоге очень сильно ограничивает возможности использования их генеративного чат-бота. Разработчики вырезали из бота любые сомнительные ответы. Не получится, например, спросить «Люди какой национальности совершают больше преступлений в России на основании таких-то объективных данных». Этот вопрос будет воспринят ботом как недопустимый. Тут есть сходство с цензурой ChatGPT, но в отличие от последнего, Яндекс GPT не дает возможности обойти цензурное ограничение через контекст. 


Яндекс 300 

Нейросеть умеет делать краткие выжимки и резюмировать статьи. Эта функция работает с эффективностью 60%, по нашим наблюдениям. И те 60%, с которыми модель справляется, обработаны очень хорошо. Может легко найти применение в бизнесе. Например, мы «скармливали» этой сети расшифровку записи звонков клиентам компании, порой в не очень систематизированном виде, и в итоге получали вполне доступную тезисную выжимку разговора. 

«Балабоба» 

Исключительно игровой инструмент, представляющий собой эксперимент по автоматической генерации текстов, продолжающих фразу. Как и Яндекс GPT имеет цензурные ограничения, но менее жесткие. Например, при определенном выстраивании контекста модель может «балаболить» что-нибудь об интимной жизни, оружии или национальностях. Юмор у модели YaLM своеобразный, но не очень смешной. Если кратко: забавно, интересно, бесполезно. 

«Шедеврум»  

Если рассматривать применимость результатов, то неплохой инструмент для генерации изображений, но пока неприменимый в бизнесе. По моему субъективному мнению и исходя из опыта, слабее чем MidJourney и Stable Diffusion. Можно отнести «Шедевум» к инструментам первого поколения. 

Это уже не совсем игрушка, но для полноценного использования не хватает предсказуемости результатов и дополнительных сетей и параметров. Особенно ограничивает необходимость использования мобильного приложения. Предполагаю, что существующее мобильное приложение создано для дообучения нейросети и если на его базе будет создаваться инструмент для рабочих задач, он получит веб-версию. 

Нейросети «Сбера»

Важной особенностью нейросетей «Сбера» стала не только их доступность в облаке Cloud.ru, но и то, что каждое решение можно приземлить в защищенный периметр. Например, что логично, учитывая основную сферу занятий вендора, в защищенный периметр банка. Это позволяет работать, например, с персональными данными. Такой подход выгодно отличает эти продукты и делает их более привлекательными для бизнеса. 

Kandinsky 2.1 

Нейросеть «Сбера» шагнувшая значительно дальше, чем «Шедеврум» от «Яндекса». Модель прошла несколько публичных релизов и ее уже можно использовать для задач бизнеса, причем результаты сопоставимы с MidJourney, Stable Diffusion и другими мировыми аналогами. От западных конкурентов немного отстаёт инструментарий и возможность выбора моделей, но в целом продукт можно оценить как очень перспективный. 

GigaChat

На этапе закрытого бета-тестирования нейросеть показала себя достаточно хорошо, по всей видимости, чат обещает быть достаточно многообещающим. Известно, что «Сбер» внедряет (или уже внедрил) свои нейросети в коммуникационные продукты и сервисы, в частности,  виртуальный помощник «Салют» получил интеграцию с GigaChat. 

Вендор считает, что GigaChat станет инструментом журналистов, программистов, редакторов, педагогов и маркетологов. По неизвестной причине открытый доступ к продукту после закрытого бета-тестирования был прекращен, но нет сомнений в том, что решение станет доступно широкому кругу пользователей и бизнесу. 

NeONKA 

Неплохой инструмент для маркетологов, который способен генерировать заголовки. Учитывая, что хороший заголовок — половина успеха компании, модель почти наверняка будет востребована ленивыми журналистами и редакторами, сотрудниками отделов рекламы, блогерами и админами телеграм-каналов.

Детекция СИЗ

Узкоспециализированная нейросеть, доступная как коммерческое решение, которая позволяет распознавать на человеке наличие и отсутствие средств индивидуальной защиты, например, масок, жилетов, касок и т.п. Может широко применяться на производствах с жесткими нормами по соблюдению техники безопасности и практически исключить человеческий фактор при контроле использования средств индивидуальной защиты (СИЗ). 

Нейросети, фиксирующие нарушения на дорогах 

Создаются непубличными компаниями, большинство из которых более 10 лет используют нейросети для контроля соблюдения правил дорожного движения. Пожалуй, самые коммерчески успешные нейросети в России. 

По количеству дорожных камер Россия занимает первое место в мире, оно оценивается в 27 тыс. штук. По данным Научного центра безопасности дорожного движения МВД России, камеры позволяют фиксировать, а нейросети распознают до 90%, то есть около 183 млн правонарушений в год. После массовой  установки в 2011 году таких камер, общее количестве правонарушений снизилось на 33%, а количество ДТП сократилось на 36,6%. Известно, что в России, только за 2020-й, использование камер позволило пополнить казну штрафами на 117 млрд руб. 

***

В России регулярно ведется разработка и обучение нейросетей. Не исключено, что новые продукты догонят или будут сопоставимы с западными образцами. Но очевидно, что создать функционально близкие к мировым лидерам технологии удастся не скоро. Для форсированного развития нейросетей нужны крупные инвестиции. Между тем, многие нейросети, созданные в России, прекрасно справляются со своими задачами, способны снижать издержки, сокращать затраты времени, а некоторые приносят прямую прибыль.








Поделиться новостью