Голосовой бот может синтезировать эмоции
Это новшество помогает при работе с клиентами и добавит положительных эмоций при общении с чат-ботами, а также на уменьшение числа клиентов, которые предпочитают разговаривать с операторами, а не с роботами.
Эмоции в синтезированной речи сделают общение с виртуальным помощником более естественным. Например, если клиент выражает недовольство услугами, голосовой бот сможет ответить с нотками грусти и удивления, а при сообщении о выигрыше использовать радостный тон. Эта технология также найдет применение в создании виртуальных помощников и игровых персонажей.
Для внедрения новой функции четыре диктора, чьи голоса используются в Audiogram, записали по два часа текста с различными эмоциями. На основе этих данных команда MTS AI дообучила нейросеть, на которой работает сервис. В будущем планируется расширение доступных эмоций для различных бизнес-партнеров.
«Эмоционально насыщенная синтезированная речь будет востребована в колл-центрах банков, ритейлеров, телеком-компаний и других крупных организаций, активно использующих голосовых ботов для общения с клиентами. Мы наблюдаем высокий интерес к эмпатичной коммуникации – многие клиенты готовы взаимодействовать с чат-ботами, если их речь будет напоминать человеческую как по смыслу, так и по интонации», — отметил менеджер продукта Audiogram Иван Дулов.
При синтезе речи можно не только выбирать эмоцию, но и настраивать произношение, скорость, высоту тона и добавлять паузы с помощью SSML-тегов. Также возможно применить определенный голос и эмоцию ко всему тексту без разметки. Платформа может использоваться для создания уникального голоса бренда и в образовательных целях, например, для подготовки аудиолекций, озвучивания статей и создания материалов для людей с ограниченными возможностями, включая слабовидящих.