Распознавание речи с помощью Google Speech API — различия между версиями

Материал из Oktell
Перейти к: навигация, поиск
м
 
(не показано 9 промежуточных версии этого же участника)
Строка 3: Строка 3:
 
'''Google Speech API''' - сервис распознавания голоса Google.  
 
'''Google Speech API''' - сервис распознавания голоса Google.  
  
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>не применимо управление с помощью тонального набора</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
+
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
  
 
  <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
 
  <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
Строка 32: Строка 32:
 
'''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.
 
'''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.
  
'''Скачать сценарий:''' [http://wiki.oktell.ru/images/0/05/Google_Speech_API.zip Google_Speech_API.zip] (для версий '''Oktell''' старше 2.10)
+
'''Скачать сценарий:''' [[Media:Google_Speech_API.zip|Google_Speech_API.zip]] (для версий '''Oktell''' старше 2.10)
  
 
В архиве располагаются два сценария:
 
В архиве располагаются два сценария:
 
*'''Google_Speech_API_main''' - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
 
*'''Google_Speech_API_main''' - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
*'''Google_Speech_API''' - сценарий для отправки записи на сервис Яндекса и приема распознанного сообщения.
+
*'''Google_Speech_API''' - сценарий для отправки записи на сервис Google и приема распознанного сообщения.
  
 
После импорта сценариев в '''Oktell''', сохраните их "'''На сервер'''"
 
После импорта сценариев в '''Oktell''', сохраните их "'''На сервер'''"
  
<span style="color:red">ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.  
+
<span style="color:red">ВНИМАНИЕ:</span> Google Speech API — это платный продукт. В сценарии (компонент Web-запроса '''GoogleVoice''') используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.  
 +
 
 +
 
 +
[[Файл:Google Speech API 3.png|center]]
 +
 
  
  
Строка 59: Строка 63:
  
 
Полученный текст передается в переменной '''text''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример  '''Google_Speech_API_main''' для использования сервиса распознавания в главном сценарии.
 
Полученный текст передается в переменной '''text''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример  '''Google_Speech_API_main''' для использования сервиса распознавания в главном сценарии.
 +
 +
 +
[[Файл:Google Speech API 4.png|center]]

Текущая версия на 11:31, 31 марта 2023

Наверх

Google Speech API - сервис распознавания голоса Google.

Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:

Система: Здравствуйте. Куда вы хотите лететь?
Абонент: Казань
Система: Откуда вы хотите лететь?
Абонент: Москва
Система: Назовите дату вылета
Абонент: 10 апреля

Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.

Система распознавания голосовых запросов применяется во многих системах, например, для:

  • Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
  • Распознавания адреса для доставки
  • Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
  • Справочной системы информационного обслуживания
  • Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)


Система распознавания речи, как правило, состоит из следующих частей:

  • Запись сообщения от абонента
  • Распознавание голоса и прием текстовых данных от сервиса
  • Анализ полученной информации и выполнение необходимых действий

Для использования Google Speech API в вашей системе выполните следующие действия:


Шаг 1. Скачайте и импортируйте сценарии в вашу систему Oktell.

Скачать сценарий: Google_Speech_API.zip (для версий Oktell старше 2.10)

В архиве располагаются два сценария:

  • Google_Speech_API_main - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
  • Google_Speech_API - сценарий для отправки записи на сервис Google и приема распознанного сообщения.

После импорта сценариев в Oktell, сохраните их "На сервер"

ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии (компонент Web-запроса GoogleVoice) используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.


Google Speech API 3.png


Шаг 2. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Google_Speech_API_main.


Google Speech API-001.png


Нажмите "Сохранить". Затем "Применить".


Шаг 3. При звонке на заданный номер (в примере, 456), проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.


Google Speech API-002.png


Полученный текст передается в переменной text, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Google_Speech_API_main для использования сервиса распознавания в главном сценарии.


Google Speech API 4.png