Блог olenka.ai
Як працює голосовий бот?
штучний інтелект голосовий бот

Як працює голосовий робот?

Коли ми чуємо про голосового робота, дехтоуявляє взаємодію з уже застарілими IVR-технологіями. Коли металічний голос дає нескінченні вказівки, а клієнт має прослухати ледь не все меню та обирати наступні дії кнопками.

Сучасний розумний робот — це приємний співрозмовник, якого в 90 % випадків не відрізнити від справжньої людини. А завдяки штучному інтелекту він справляється з типовими завданнями навіть ефективніше за менеджера.

Голосових ботів можна використовувати для холодних дзвінків, маркетингових та комерційних розсилок, опитувань, нагадувань, збору зворотного зв’язку тощо. Завдання програм для обдзвона — розвантажити менеджерів. А як працює телефонний робот — простими словами розповіла засновниця Olenka.ai Олена Дишкант.


Три головних складових розумного бота


«Як розробники ми розцінюємо голосових ботів у якості систем, що складаються з 3-х основних компонентів. Перший — телефонія. Я раджу IP-телефонію. Ця технологія ефективніше за аналогів працює з дзвінками. Найперше, завдяки спеціальним вузлам (транкам) можна одночасно телефонувати на сотні номерів. Важливо й те, що IP-телефонія дозволяє записувати розмови, контролювати пропущені дзвінки, фіксувати статистику тощо.

Друга обов’язкова складова — технологія розпізнавання, наприклад, STT (speech to text). Це може бути власна розробка або стороння програма. Особисто ми зупинилися на тому, щоб поєднати розробки кількох інших компаній для кращого нацей момент результату розпізнавання, а в майбутньому — створити власну».

Приклад такого сервісу — хмарні технології на зразок Google Speech API, які розпізнають мовлення та транскрибують його в текст. Для цього робот у режимі реального часу ділить кожне речення на фрагменти й аналізує їх спочатку окремо, а потім — за контекстом. Більшість ботів шукає відповідності між словами та їхнім тлумаченням у пошукачі. Наприклад, у випадку з Google Speech API це — Google.

Програми обдзвону нового покоління працюють не тільки зі словниками пошукача, а й зі спеціальними, створеними для кожного окремого проєкту. Їх складають лінгвісти та маркетологи. Спеціалісти вивчають проблему, поширені запитання та відповіді, прогнозують можливі варіанти розвитку діалогу. Потім вони визначають переліки слів та фраз, що можуть мати одне й те саме або (залежно від контексту) зовсім інше значення. Уже після цього робота навчають розпізнавати їх.

Наприклад, розумний бот пропонує придбати квитки на виставу, а людина йому відмовляє. Вона може зробити це, сказавши щось на зразок «не треба, «дякую, але», «даруйте, ні», «не телефонуйте мені більше», «зітріть мій номер із вашої бази», «запропонуйте комусь іншому», «я таке не люблю» й т. ін. В  кожному з цих та аналогічних випадків робот обере швидке завершення розмови: вибачиться та подякує за увагу.

«Третій компонент — аналог адміністративної панелі, де налаштовуються та запускаються дзвінки. Штучний інтелект присутній саме в ньому. Фактично це — модель, яку після здійснення базових налаштувань за допомогою  machine learning вчать спілкуватися. У цей процес входять робота з базами даних, з контактами абонентів, які передає клієнт, — номери зазвичай у різних форматах. Olenka.ai, наприклад, форматує дані самостійно — для клієнта це додатковий аргумент у виборі програми обдзвона», — продовжує Олена.

Попередити реакцію — збільшити шанс укладання угоди

Технології на базі штучного інтелекту використовуються тоді, коли треба підлаштуватися під людину — хід її думок, механізм прийняття рішень. Фактично, імітувати реальну реакцію. Цього й навчають голосових ботів програмісти, лінгвісти та маркетологи.

Спеціалісти з голосового маркетингу попередньо прослуховують кількасот записів реальних розмов. Вони структурують можливий перелік відповідей на всі питання та на їхній основі складають скрипти — сценарії діалогів. У кожного слова та сталого виразу є певне значення, за якими роботи «передбачають» наміри клієнта. Простими словами, робот «перекладає» почуте на зрозумілу його алгоритмам «мову» та за тригерними словами обирає наступну репліку. Завдяки цьому він майже в 100 % випадків каже те, що очікує почути клієнт.

«Коли голосовий робот працює на базі штучного інтелекту, а не жорсткого алгоритму, він вчиться прогнозувати наступну репліку клієнта. Завдяки цьому він здогадується й про те, що малося на увазі, навіть коли співрозмовник висловлюється не дуже чітко й однозначно. Тобто коли машину ще не навчили, що в якоїсь фрази може бути й інше значення, або що одне поняття людина може висловити різними способами», — додає Олена.

Наприклад, робот пропонує клієнту взяти участь в опитуванні, цікавиться, чи зручно це зробити зараз, а він просить перетелефонувати іншим разом. Програма розуміє, що його співрозмовник не проти відповісти на кілька питань, але не може зробити цього саме зараз. Тригерами в цьому випадку можуть бути слова та фрази на зразок «не зараз», «не можу говорити», «незручно», «пізніше» тощо. Тоді робот чемно дякує, обробляє інформацію від клієнта та телефонує повторно в призначений час.

До речі завдяки сучасним технологіям не потрібно перейматися тим, що бот чогось не почує або щось переплутає. Він уже вміє відділяти голос співрозмовника від сторонніх звуків — музики, дощу, авто тощо.


Як роботи заговорили наче люди


Тепер розглянемо, як «розмовляє» сам робот. У деяких віртуальних помічників (наприклад, у Siri або автомобільного навігатора) голоси синтезовані, штучні. У цьому випадку зазвичай використовується технологія переформатування тексту в мовлення (зворотний до STT процес — text to speech). Клієнт часто відчуває дискомфорт через те, що з ним говорить машина. У неї немає емоцій (а саме вони викликають бажання придбати продукт чи пристати на пропозицію), часто вона пропускає природні паузи, неправильно ставить наголоси тощо.

Голосового бота нового покоління на кшталт Olenka.ai важко відрізнити від реального співрозмовника. По-перше, кожна його фраза — це запис, зроблений професійним диктором. Кожна гілка скрипта — це спеціальне аудіо. Тобто жодної мови про синтезування мовлення (механічного озвучування обраного варіанту тексту) не йде. По-друге, і при написанні скриптів, і для навчання робота застосовується модуль обробки природного мовлення (natural language processing). Бот вчиться не тільки сприймати зміст реплік, а й підлаштовуватися під контекст, у якому говорить людина. Завдяки цьому такі роботи можуть «відтворювати» емоції, тональність розмови та навіть жартувати.

«Ефективний голосовий робот — досить складна програма. Особливо з огляду на те, що ми маємо створювати позитивний клієнтський досвід та забезпечити швидке, комфортне обслуговування. Саме тому симбіоз технологій та участі в роботі над проєктами спеціалістів має велике значення. Є дослідження, за результатами якого 71 % респондентів надають перевагу «живим», а не синтетичним голосам. І розробники можуть задовольнити цю потребу», — додає Олена Дишкант.

Технології не стоятимуть на місці, й розумні боти з часом зможуть виконувати все складніші завдання. Це — вдале рішення й для великих корпорацій, і для малого бізнесу, що стоїть на порозі масштабування. З ним можна пришвидшити та покращити якість обслуговування клієнтів, стимулювати продажі, збільшити прибутки та зекономити на штаті співробітників. Якщо у вас є сумніви чи додаткові питання — ви завжди можете звернутися за консультацією до професіоналів та вирішити, чи потрібен вам голосовий робот саме зараз.
=-її-