15:30 / 23 октября 2025
«Яндекс» научил «Алису» понимать голос в шуме - IT Speaker, новости информационных технологий
Компания «Яндекс» разработала инновационную нейросетевую технологию распознавания голосовых команд в условиях сильного шума. Новое решение уже внедрено в «умные» колонки и ТВ-приставки с голосовым помощником «Алиса».
«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях», – пояснил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха.
Разработчикам удалось решить эту проблему с помощью особого attention-механизма, который параллельно анализирует два обработанных аудиопотока – один после эхоподавления, другой после шумоподавления. Нейросеть в режиме реального времени выбирает наиболее четкий сигнал, что позволяет избежать характерных искажений традиционных методов фильтрации.
«Обычно в "умных" устройствах и ассистентах используют алгоритмы эхоподавления, которые помогают распознать голос на фоне музыки. Уменьшить другие фоновые звуки помогают алгоритмы шумоподавления, но они ухудшают и человеческую речь», – заявили РБК в компании.
«Яндекс» планирует опубликовать научную статью с детальным описанием разработки. По мнению авторов, это может стимулировать прогресс в области голосовых интерфейсов и улучшить пользовательский опыт взаимодействия с «умными» устройствами.
Ранее редакция IT Speaker сообщала, что количество пользователей «Алисы», работающей на языковой модели YandexGPT, в июне превысило 43 млн человек.
Поделиться новостью
15:30 / 23 октября 2025
15:00 / 23 октября 2025
14:30 / 23 октября 2025
14:00 / 23 октября 2025
15:30 / 23 октября 2025
15:00 / 23 октября 2025
14:30 / 23 октября 2025
14:00 / 23 октября 2025