Распознавание речи с помощью Yandex SpeechKit Сloud — различия между версиями
Строка 57: | Строка 57: | ||
− | '''Шаг 3.''' В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры: | + | '''Шаг 3.''' Для примера покажем простейшую маршрутизацию, основанную на распознавании речи. Сценарий выглядит следующим образом: |
+ | |||
+ | |||
+ | [[Файл:Yandex ASR Cloud 002.png|center]] | ||
+ | |||
+ | |||
+ | В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры: | ||
*'''uuid''' - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки. | *'''uuid''' - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки. | ||
*'''key''' - API-ключ для подключения к сервису '''Yandex ASR Cloud'''. | *'''key''' - API-ключ для подключения к сервису '''Yandex ASR Cloud'''. |
Версия 18:12, 2 июля 2014
Yandex ASR Сloud – сервис для распознавания голосовых запросов на русском языке.
Это платный модуль, для использования которого необходимо заключить договор с Яндексом. Стоимость зависит от количества запросов в сутки.
Скачать шаблон договора (.doc) Отправить заявку на подключение модуля: sheechkit@yandex-team.ru
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда управление с помощью тонального набора неудобно. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор из большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
Система: Здравствуйте. Куда вы хотите лететь? Абонент: Казань Система: Откуда вы хотите лететь? Абонент: Москва Система: Назовите дату вылета Абонент: 10 апреля
Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.
Распознавание голосовых запросов применяется во многих системах, например, для:
- Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
- Распознавания адреса для доставки
- Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
- Справочной системы информационного обслуживания
- Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)
Внедрение такой системы позволит автоматизировать определенные задачи по обработке входящих звонков, упростит взаимодействие клиента с системой и сократит суммарное время ожидания клиента на линии. Тем самым в вашей компании будут высвобождены значительные ресурсы операторов, что позволит распределить на другие не менее важные задачи.
Система распознавания речи, как правило, состоит из следующих частей:
- Запись сообщения от абонента
- Распознавание речи и прием текстовых данных от сервиса
- Анализ полученной информации и выполнение необходимых действий
Для использования Yandex ASR Cloud в вашей системе выполните следующие действия:
Шаг 1. Для получения API-ключа отправьте e-mail на адрес speechkit@yandex-team.ru, с кратким описанием задачи, которую Вы собираетесь решать с помощью Yandex ASR Cloud.
Тестовый период (бесплатный) – 2 недели с момента получения ключа.
Шаг 2. Перейдите в Администрирование / Общие настройки / Распознавание речи Яндекс. Введите полученный ключ доступа в поле "Ключ доступа (key)"
Нажмите "Сохранить". Теперь вы можете использовать распознавание речи в сценариях.
Шаг 3. Для примера покажем простейшую маршрутизацию, основанную на распознавании речи. Сценарий выглядит следующим образом:
В сценарии Yandex_SpeechKit_Recognition_IVR в компоненте "Required params" определите следующие параметры:
- uuid - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
- key - API-ключ для подключения к сервису Yandex ASR Cloud.
- topic - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
- freeform - диктовка текста, СМС, email, заметки
- general - распознавание поисковых запросов и коротких фраз на различные тематики
- maps - распознавание адресов, названий организаций и различных географических объектов
- music - распознавание названий песен, исполнителей, групп
По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "На сервер".
Шаг.4. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Yandex_SpeechKit_Recognition_main.
Нажмите "Сохранить". Затем "Применить".
Шаг 5. При звонке на заданный номер, проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.
Полученный текст передается в переменной parse_bestText, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Yandex_SpeechKit_Recognition_main для использования сервиса распознавания в главном сценарии.
Шаг 6. Если Вас устраивает тест, Вы заключаете договор с Яндексом. Отчетный период начинается с даты подписания договора. Оплата происходит по окончанию отчетного периода на основании подписанного акта.
Дополнение: Также вы можете скачать служебный сценарий интеграции с системой Yandex SpeechKit. Сценарий может использоваться для off-line распознавания голосовых файлов. На вход сценария необходимо передать путь к файлу с записью.