Распознавание речи с помощью Google Speech API — различия между версиями
м |
|||
(не показано 9 промежуточных версии этого же участника) | |||
Строка 3: | Строка 3: | ||
'''Google Speech API''' - сервис распознавания голоса Google. | '''Google Speech API''' - сервис распознавания голоса Google. | ||
− | Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда | + | Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом: |
<span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь? | <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь? | ||
Строка 32: | Строка 32: | ||
'''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''. | '''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''. | ||
− | '''Скачать сценарий:''' [ | + | '''Скачать сценарий:''' [[Media:Google_Speech_API.zip|Google_Speech_API.zip]] (для версий '''Oktell''' старше 2.10) |
В архиве располагаются два сценария: | В архиве располагаются два сценария: | ||
*'''Google_Speech_API_main''' - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии. | *'''Google_Speech_API_main''' - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии. | ||
− | *'''Google_Speech_API''' - сценарий для отправки записи на сервис | + | *'''Google_Speech_API''' - сценарий для отправки записи на сервис Google и приема распознанного сообщения. |
После импорта сценариев в '''Oktell''', сохраните их "'''На сервер'''" | После импорта сценариев в '''Oktell''', сохраните их "'''На сервер'''" | ||
− | <span style="color:red">ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google. | + | <span style="color:red">ВНИМАНИЕ:</span> Google Speech API — это платный продукт. В сценарии (компонент Web-запроса '''GoogleVoice''') используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google. |
+ | |||
+ | |||
+ | [[Файл:Google Speech API 3.png|center]] | ||
+ | |||
Строка 59: | Строка 63: | ||
Полученный текст передается в переменной '''text''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример '''Google_Speech_API_main''' для использования сервиса распознавания в главном сценарии. | Полученный текст передается в переменной '''text''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример '''Google_Speech_API_main''' для использования сервиса распознавания в главном сценарии. | ||
+ | |||
+ | |||
+ | [[Файл:Google Speech API 4.png|center]] |
Текущая версия на 11:31, 31 марта 2023
Google Speech API - сервис распознавания голоса Google.
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
Система: Здравствуйте. Куда вы хотите лететь? Абонент: Казань Система: Откуда вы хотите лететь? Абонент: Москва Система: Назовите дату вылета Абонент: 10 апреля
Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.
Система распознавания голосовых запросов применяется во многих системах, например, для:
- Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
- Распознавания адреса для доставки
- Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
- Справочной системы информационного обслуживания
- Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)
Система распознавания речи, как правило, состоит из следующих частей:
- Запись сообщения от абонента
- Распознавание голоса и прием текстовых данных от сервиса
- Анализ полученной информации и выполнение необходимых действий
Для использования Google Speech API в вашей системе выполните следующие действия:
Шаг 1. Скачайте и импортируйте сценарии в вашу систему Oktell.
Скачать сценарий: Google_Speech_API.zip (для версий Oktell старше 2.10)
В архиве располагаются два сценария:
- Google_Speech_API_main - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
- Google_Speech_API - сценарий для отправки записи на сервис Google и приема распознанного сообщения.
После импорта сценариев в Oktell, сохраните их "На сервер"
ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии (компонент Web-запроса GoogleVoice) используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.
Шаг 2. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Google_Speech_API_main.
Нажмите "Сохранить". Затем "Применить".
Шаг 3. При звонке на заданный номер (в примере, 456), проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.
Полученный текст передается в переменной text, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Google_Speech_API_main для использования сервиса распознавания в главном сценарии.