Блог olenka.ai ru
Как голосовой бот понимает, что имеет в виду клиент
искусственный интеллект

«Да нет, наверное»: как голосовой бот понимает, что клиент имеет в виду

Голосовые технологии распознают и анализируют голос человека. Их используют для записи, расшифровки и имитации речи. Простым языком, учат компьютеры понимать отдельные слова и фразы.

Программы автоматических звонков можно использовать во всех сферах, где основной инструмент менеджера — телефонный разговор по скрипту. Обычно в нём предусматривают сразу несколько ветвей в зависимости от типичных человеческих реакций.

Процесс распознавания, анализа и синтеза человеческой речи роботом сложный. Он объединяет сразу три дисциплины: программирование, математику и лингвистику.

С самого начала работ анализирует реплику в режиме реального времени благодаря облачной технологии распознавания речи вроде Google Speech API, где каждому слову соответствует чёткое, понятное для бота значение.

Фраза делится на фрагменты с учётом синтаксиса, семантики и других признаков. Они поочерёдно отправляются на сервер облачного сервиса распознавания, который «превращает» звук в текст. Потом программа проверяет каждое слово на соответствие — это похоже на использование толкового словаря. То есть «да» — это согласие, «нет» — отказ и т. д.

Кроме того, робот ориентируется на заранее составленную «под проект» базу частых вопросов и ответов. По ней он определяет контекст и даже эмоцию. Проанализировав такой большой массив данных, программисты с помощью машинного или глубокого обучения тренируют робота разговаривать с человеком. Это вкратце о том, как он генерирует и озвучивает ответ. 

Но есть фразы, которые и не каждый человек правильно поймёт. Одна из показательных «проблемных» реплик — «Да нет, наверное». Иностранец, например, растерялся бы, если бы перевёл «да» как согласие, «нет» — как отказ и «наверное» — как сомнение. Как и большинство роботов. Когда голосовой бот работает только со скриптом или жёстким алгоритмом, он может не понять такую ​​неоднозначную фразу, и разговор пойдёт в другом направлении.

Мы в Olenka.ai не полагаемся только на скрипты или способность нейронных сетей обучаться и выполнять всё более сложные задачи. Все сценарии для нашего голосового бота настраивают профессионалы, которые много лет работают с автоматическими звонками. Они прорабатывают не просто слова, как, например, Google Speech API, а намерения. Благодаря этому фразу «Да нет, наверное» умный робот интерпретирует так: скорее всего, клиент отказывается, но у него остаются определённые сомнения, с которыми можно попробовать поработать.

Olenka.ai — это программа на основе искусственного интеллекта. Она умеет анализировать реплики и распознавать слова чётче, чем голосовые роботы предыдущих поколений. Чем дольше мы работаем с абонентами в рамках каждого проекта, тем лучше понимаем аудиторию. Так мы учим бота распознавать нетипичные фразы, правильно находить соответствие и даже шутить. То есть согласие для Olenka.ai — это уже не только слово «да», а и «окей», «договорились», «конечно» и др. Благодаря такой глубинной проработке каждого слова наш голосовой робот почти в 100% случаев знает, что именно человек говорит.

Что это значит для компаний, которые решат использовать Olenka.ai для автообзвона? 
Самое важное — это сочетание искусственного интеллекта и опыта профессионалов. Благодаря этому голосовые рассылки любого типа (от коротенького опроса до воронки продаж) окупят себя, не вызовут негативную реакцию и принесут желаемый результат.

Программы обзвона — эффективное и выгодное решение для любого бизнеса. Уже сегодня в 90% случаев человек не догадывается, кто именно с ним общается, — робот или менеджер. Технологии распознавания речи постоянно развиваются. Поэтому их можно считать одним из самых перспективных направлений в области искусственного интеллекта.