Распознавание речи с помощью Yandex SpeechKit Сloud

Материал из Oktell
Перейти к: навигация, поиск

Наверх

Yandex SpeechKit - система для распознавания голосовых запросов на русском языке. Система применяется для сценариев IVR и систем маршрутизации звонков.

Система распознавания голосовых запросов используется во многих системах, например, для

  • Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
  • Распознавания адреса для доставки
  • Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет.
  • Справочной системы информационного обслуживания
  • Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)

Алгоритм распознавания речи состоит из следующих частей:

  1. Запись сообщения от абонента
  2. Распознавание голоса и получение информации в виде строки
  3. Анализ полученной информации и выполнение полученных действий


Для использования Yandex SpeechKit в вашей системе выполните следующие действия:

Шаг 1. Скачайте и импортируйте сценарии в вашу систему Oktell.

Скачать сценарии: Yandex_SpeechKit_Recognition.zip

В архиве располагаются два сценария:

  • Yandex_SpeechKit_Recognition - сценарий для записи голосового сообщения
  • Yandex_SpeechKit_Recognition_svc - сценарий для отправки записи на сервис Яндекса и приема распознанного сообщения.

После импорта сценариев в Oktell, сохраните их "На сервер"

Шаг 2. В сценарии Yandex_SpeechKit_Recognition_svc в компоненте "Required params" определите следующие параметры:

  • uuid - уникальная строка для подключения
  • key - секретный ключ для подключения к сервису Yandex SpeechKit. Запросить ключ можно по почте speechkit@yandex‐team.ru или на сайте разработчиков.
  • topic - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
    • freeform - свободная форма (SMS, заметка и др.)
    • general - запросы для поиска в Интернете
    • maps - географические названия (адрес, место, названия ресторанов и др.)
    • music - музыкальные названия (музыкальные группы, названия песен, певцы и др.)

По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "На сервер".


Yandex SpeechKit Recognition -001.png


Шаг 3. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Yandex_SpeechKit_Recognition.


Yandex SpeechKit Recognition -002.png


Нажмите "Сохранить". Затем "Применить".


Шаг 4. При звонке на заданный номер, проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.


Yandex SpeechKit Recognition -003.png


Полученный текст затем можно проанализировать и выполнить необходимые действия.