Блог olenka.ai ru
Как работает голосовой бот?
искусственный интеллект

Как работает голосовой робот?

Когда мы слышим о голосовом роботе, некоторые представляют разговоры с уже устаревшими IVR-технологиями. Это когда металлический голос даёт бесконечные указания, а клиент вынужден слушать запись и выбирать следующие действия кнопками.

Современный умный робот — это приятный собеседник, в 90% случаев он неотличим от человека. А благодаря искусственному интеллекту бот справляется с рутинными заданиями даже эффективнее менеджера.

Голосовых роботов используют для холодных звонков, маркетинговых и коммерческих рассылок, опросов, напоминаний, сбора обратной связи и т. п. Задача программ для обзвона — разгрузить менеджеров. А как работает телефонный робот — простыми словами рассказала основательница Olenka.ai Олена Дишкант.


Три главных составляющих  умного бота


«Для нас, разработчиков, голосовые роботы — это трёхкомпонентные системы. Первый из них — телефония. Я советую IP-телефонию. Эта технология лучше других работает со звонками. Например, благодаря специальным узлам (транкам) можно одновременно звонить на сотни номеров. Важно и то, что IP-телефония записывает разговоры, контролирует пропущенные звонки, выводит статистику и пр.

Вторая обязательная составляющая — технология распознавания, например, STT (speech to text). Собственная или продукт другой компании — не так и важно. Лично мы остановились на том, чтобы совместить сервисы нескольких разработчиков для лучшего на сегодня результата распознавания, а в будущем — создать собственный».

Пример такого продукта — облачные технологии, как Google Speech API. Они распознают человеческую речь и преобразовывают её в текст. Для этого робот в реальном времени делит каждое предложение на фрагменты и анализирует их сначала по отдельности, а затем — в контексте. Большинство ботов ищет соответствия между словами и их толкованием в поисковике, на базе которого работает. Например, в случае с Google Speech API это — Google.

Программы обзвона нового поколения работают не только с поисковыми словарями, но и со специальными. Их для каждого отдельного проекта составляют лингвисты и маркетологи. Они изучают проблематику, часто задаваемые вопросы и ответы, прогнозируют возможные варианты развития диалога. Затем определяют список слов, которые могут иметь одинаковое или (в зависимости от контекста) совсем другое значение. После используются технологии machine learninig — робота учат поиску правильных соответствий.

Например, умный бот предлагает приобрести билеты на спектакль, а человек отказывается. Это может звучать по-разному: «не надо», «спасибо, но», «извините, нет», «не звоните мне больше», «удалите этот номер», «предложите кому-то другому», «я такого не люблю» и т. д. В каждом из таких случаев робот выберет быстрое завершение разговора: извинится и поблагодарит за внимание.

«Третий компонент — аналог административной панели, где настраиваются и запускаются звонки. Искусственный интеллект присутствует именно в нём. Фактически это — модель, которую настраивают и учат общаться. В этот процесс входит работа с базами данных, контактами абонентов, которые даёт клиент, — номера обычно указаны в самых разных форматах. Olenka.ai, например, самостоятельно приводит их в порядок — для клиента это дополнительный аргумент в выборе программы обзвона», — продолжает Олена.


Предупредить реакцию — увеличить шанс заключения сделки


Технологии на базе искусственного интеллекта используются тогда, когда нужно подстроиться под человека: ход мыслей, то, как он принимает решения. То есть имитировать реальную реакцию — этому программисты с маркетологами и учат умных ботов

Специалисты в области голосового маркетинга предварительно прослушивают сотни записей реальных разговоров. Они составляют возможный перечень вопросов и ответов на них — так пишутся скрипты, или сценарии разговоров. 

Каждому слову и выражению соответствует определённое значение. Находя это соответствие, роботы «предугадывают» намерения клиента. Простыми словами, бот «переводит» услышанное на понятный его алгоритмам «язык», находит триггерные слова и по ним подбирает следующую реплику. В отличие от человека, он почти в 100% случаев говорит то, что клиент от него и ожидает.

«Когда голосовой робот работает на базе искусственного интеллекта, а не жёсткого алгоритма, он учится прогнозировать следующую фразу клиента. Бот догадывается, что имеется в виду, даже если собеседник высказывается не слишком чётко и однозначно. То есть когда машину ещё не научили, что у какой-то фразы бывает и другое значение, или что одно понятие можно выразить разными словами», — добавляет Олена.

Например, робот предлагает клиенту поучаствовать в опросе, интересуется, удобно ли это, а тот в ответ просит перезвонить. Программа понимает, что её собеседник не против пообщаться и, вероятно, заинтересовался, но в этот момент времени такой возможности у него нет. Триггерами в этом случае могут быть «не сейчас», «не могу говорить», «неудобно», «позже» и др. В таком случае робот вежливо благодарит, обрабатывает информацию и звонит повторно в назначенное время.

Благодаря современным технологиям не нужно беспокоиться и о том, что бот не расслышит или перепутает что-то. Он уже умеет отделять голос собеседника от посторонних звуков — музыки, дождя, авто и пр. 


Как роботы заговорили словно люди


Теперь рассмотрим, как «разговаривает» сам робот. У некоторых виртуальных помощников (например, Siri или автомобильного навигатора) голоса синтезированные, искусственные. В этом случае используется технология переформатирования текста в речь (обратный к STT процесс, или text to speech). Клиент часто испытывает дискомфорт из-за того, что с ним говорит машина. У неё нет эмоций (а именно они вызывают желание приобрести продукт или принять предложение), бот часто пропускает естественные паузы или неправильно ставит ударения.

Робота нового поколения, как Olenka.ai, почти не отличить от реального собеседника. Каждая его фраза — это запись, сделанная профессиональным диктором. То есть мы не используем технологии синтезирования речи (механической озвучки выбранного варианта текста). В написании скриптов и обучении робота наши программисты применяют модуль обработки естественного языка (natural language processing). С ним бот учится воспринимать содержание фраз, подстраиваться под контекст. Благодаря этому умные роботы могут «воспроизводить» эмоции, тональность разговора и даже шутить.

«Эффективный голосовой робот — сложная программа. Особенно если учесть, что мы создаём положительный клиентский опыт и обеспечиваем быстрое, комфортное обслуживание. Поэтому симбиоз технологий и человеческого вклада в работу над проектом очень важен. Одно исследование сообщает, что 71% респондентов предпочитает «живые», а не синтетические голоса. И разработчики могут создавать продукты, которые этому желанию соответствуют», — добавляет Олена Дишкант.

Технологии постоянно развиваются, и со временем задания для умных ботов будут усложняться. Это — эффективный инструмент и для крупных корпораций, и для малого бизнеса с перспективами развития. Голосовой робот повысит качество обслуживания клиентов, стимулирует продажи, увеличит доходы и позволит сэкономить на штате сотрудников. Если у вас есть сомнения или дополнительные вопросы — обращайтесь за консультацией к профессионалам, они подскажут, нужен ли вам умный робот именно сейчас.