MTS AI наделила ботов эмоциями - IT Speaker, новости информационных технологий

MTS AI наделила ботов эмоциями

Редакция

19:00 / 29 августа 2024

Компания MTS AI внедрила в свой сервис Audiogram возможность выбора эмоций при синтезе речи. Теперь нейросети могут воспроизвести пять основных эмоций: спокойствие, радость, злость, грусть и удивление.

Использование эмоциональной окраски в синтезированной речи поможет сделать диалог с виртуальными ассистентами более естественным и логичным. Например, голосовой бот сможет ответить с грустью и удивлением на жалобы клиентов или использовать радостные интонации при сообщении победителям розыгрышей.

Для реализации новой функции четыре диктора, голоса которых используются в Audiogram, дополнительно записали по два часа текста с разными эмоциями. На этих данных команда MTS AI дообучила нейронную сеть сервиса.

По словам менеджера Audiogram Ивана Дулова, эмоциональная синтезированная речь будет востребована в колл-центрах банков, ритейлеров, телекоммуникационных компаний и других организаций, активно использующих голосовых ботов. Клиенты готовы общаться с чат-ботами, если их речь будет близка к человеческой не только по смыслу, но и по интонациям.

Помимо выбора эмоции, у пользователей Audiogram есть возможность настраивать произношение слов, скорость и высоту тона, а также добавлять паузы с помощью SSML-тегов.

Ранее некоторые пользователи столкнулись с тем, что нейросеть ChatGPT неожиданно начала разговаривать клонированным голосом пользователей. Это произошло при использовании нового режима голосового общения.

В OpenAI заявили, что это произошло случайно. Компания уже приняла меры и начала использовать систему обнаружения несанкционированного генерирования звуков, чтобы в дальнейшем такого не повторилось. Отмечается, что такое поведение сети крайне редко и было зафиксировано лишь на стадии тестирования.

Поделиться новостью