Блог olenka.ai
Як зрозуміти неоднозначні відповіді
штучний інтелект

— «Да ні, мабуть»: як голосовий бот розуміє, що має на увазі клієнт

Голосові технології розпізнають та аналізують голос людини. Їх використовують для запису, розшифровки та імітації мовлення — вчать комп’ютери розуміти окремі слова та фрази.

Програми автодзвінків стануть у пригоді в будь-якій сфері, де основний інструмент працівника — телефонна розмова за скриптом. Зазвичай у ньому передбачено одразу кілька гілок залежно від типових людських реакцій.

Насправді процес розпізнавання, аналізу та синтезу роботом людської мови складний та поєднує одразу три дисципліни: програмування, математику та лінгвістику.

Із самого початку робот аналізує репліку в режимі реального часу завдяки хмарній технології розпізнавання мовлення на зразок Google Speech API, де в кожного слова є чітко прописане і зрозуміле для бота значення.

Фраза ділиться на фрагменти за синтаксисом, семантикою й іншими ознаками. Вони поодинці надсилаються на сервер хмарного сервісу розпізнавання, де звук транскрибується в текст. Далі програма перевіряє кожне слово на відповідність — це схоже на користування тлумачним словником. Тобто «так» — це згода, «ні» — відмова й т. ін.

Крім того, голосовий робот орієнтується на заздалегідь сформовану під проєкт базу типових запитань та відповідей, за якою визначає контекст та навіть емоцію. На основі такого великого масиву даних програмісти застосовують технології машинного або глибокого навчання і тренують робота вести діалог. Так він генерує відповідь та озвучує її.

Але є фрази, котрі навіть не кожна людина зрозуміє правильно. Одна з показових «проблемних» реплік — «Да ні, мабуть» («Да нет, наверное»). Іноземець, наприклад, міг би розгубитися, інтерпретувавши «так» як згоду, «ні» — як відмову й «мабуть» — як сумнів. Як і більшість роботів. Якщо голосовий помічник працює тільки за скриптом або жорстким алгоритмом, то він може не зрозуміти таку неоднозначну фразу — розмова піде геть в іншому напрямку.

В Olenka.ai не покладаються тільки на скрипти або здатність нейронних мереж до навчання та виконання все складніших завдань. Усі сценарії для цього голосового бота налаштовують професіонали, які багато років працюють з автоматичними дзвінками. Вони опрацьовують не просто слова, як, наприклад, Google Speech API, а наміри. Завдяки цьому фразу «Да ні, мабуть» розумний робот інтерпретує так: швидше за все, клієнт відмовляється, але в нього залишаються певні сумніви.

Olenka.ai — це система на основі штучного інтелекту, яка може аналізувати репліки й більш чітко розпізнавати значення слів. І чим довше команда працює з абонентами в рамках кожного завдання, тим кращим стає розуміння аудиторії. Це дає змогу навчити бота розпізнавати нетипові фрази, правильно знаходити відповідність і навіть жартувати. Тобто згода для нього — це вже не тільки слово «так», а і «окей», «домовилися», «звичайно» тощо. Завдяки такому глибинному опрацюванню кожного слова голосовий бот Olenka.ai майже в 100% випадків знає, що саме говорить людина.

Що це значить для компаній, які вирішать зробити автообдзвін з Olenka.ai? Насамперед, поєднання штучного інтелекту й досвіду професіоналів. Завдяки цьому розсилки будь-якого змісту (від опитувань до воронок продажів) окуповують себе, не викликають негатив і дають бажаний результат.

Програми обдзвону — ефективне та вигідне рішення для будь-якого бізнесу. Уже сьогодні у 90% випадків людина не здогадується, хто саме спілкується з нею, — робот чи інша людина. Технології розпізнавання мовлення постійно розвиватимуться — саме тому їх можна вважати одним із найперспективніших напрямків у сфері штучного інтелекту.