«Яндекс» научил «Алису» понимать голос в шуме - IT Speaker, новости информационных технологий

«Яндекс» научил «Алису» понимать голос в шуме

Редакция

12:30 / 30 июля 2025

Компания «Яндекс» разработала инновационную нейросетевую технологию распознавания голосовых команд в условиях сильного шума. Новое решение уже внедрено в «умные» колонки и ТВ-приставки с голосовым помощником «Алиса».

Фотография freepik

«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях», – пояснил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха.

Разработчикам удалось решить эту проблему с помощью особого attention-механизма, который параллельно анализирует два обработанных аудиопотока – один после эхоподавления, другой после шумоподавления. Нейросеть в режиме реального времени выбирает наиболее четкий сигнал, что позволяет избежать характерных искажений традиционных методов фильтрации.

«Обычно в "умных" устройствах и ассистентах используют алгоритмы эхоподавления, которые помогают распознать голос на фоне музыки. Уменьшить другие фоновые звуки помогают алгоритмы шумоподавления, но они ухудшают и человеческую речь», – заявили РБК в компании.

«Яндекс» планирует опубликовать научную статью с детальным описанием разработки. По мнению авторов, это может стимулировать прогресс в области голосовых интерфейсов и улучшить пользовательский опыт взаимодействия с «умными» устройствами.

Ранее редакция IT Speaker сообщала, что количество пользователей «Алисы», работающей на языковой модели YandexGPT, в июне превысило 43 млн человек.

Вас может заинтересовать: 

YouTube внедрит проверку возраста через ИИ

Поделиться новостью