Распознавание речи с помощью Google Speech API — различия между версиями

Текущая версия на 11:31, 31 марта 2023

Google Speech API - сервис распознавания голоса Google.

Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:

Система: Здравствуйте. Куда вы хотите лететь?
Абонент: Казань
Система: Откуда вы хотите лететь?
Абонент: Москва
Система: Назовите дату вылета
Абонент: 10 апреля

Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.

Система распознавания голосовых запросов применяется во многих системах, например, для:

Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
Распознавания адреса для доставки
Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
Справочной системы информационного обслуживания
Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)

Система распознавания речи, как правило, состоит из следующих частей:

Запись сообщения от абонента
Распознавание голоса и прием текстовых данных от сервиса
Анализ полученной информации и выполнение необходимых действий

Для использования Google Speech API в вашей системе выполните следующие действия:

Шаг 1. Скачайте и импортируйте сценарии в вашу систему Oktell.

Скачать сценарий: Google_Speech_API.zip (для версий Oktell старше 2.10)

В архиве располагаются два сценария:

Google_Speech_API_main - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
Google_Speech_API - сценарий для отправки записи на сервис Google и приема распознанного сообщения.

После импорта сценариев в Oktell, сохраните их "На сервер"

ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии (компонент Web-запроса GoogleVoice) используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.

Шаг 2. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Google_Speech_API_main.

Нажмите "Сохранить". Затем "Применить".

Шаг 3. При звонке на заданный номер (в примере, 456), проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.

Полученный текст передается в переменной text, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Google_Speech_API_main для использования сервиса распознавания в главном сценарии.

@@ Строка 3: / Строка 3: @@
 '''Google Speech API''' - сервис распознавания голоса Google.
-Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>не применимо управление с помощью тонального набора</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
+Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда не применимо управление с помощью тонального набора. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
   <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
@@ Строка 32: / Строка 32: @@
 '''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.
-'''Скачать сценарий:''' [http://wiki.oktell.ru/images/0/05/Google_Speech_API.zip Google_Speech_API.zip] (для версий '''Oktell''' старше 2.10)
+'''Скачать сценарий:''' [[Media:Google_Speech_API.zip|Google_Speech_API.zip]] (для версий '''Oktell''' старше 2.10)
 В архиве располагаются два сценария:
 *'''Google_Speech_API_main''' - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
-*'''Google_Speech_API''' - сценарий для отправки записи на сервис Яндекса и приема распознанного сообщения.
+*'''Google_Speech_API''' - сценарий для отправки записи на сервис Google и приема распознанного сообщения.
 После импорта сценариев в '''Oktell''', сохраните их "'''На сервер'''"
-<span style="color:red">ВНИМАНИЕ: Google Speech API — это платный продукт. В сценарии используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.
+<span style="color:red">ВНИМАНИЕ:</span> Google Speech API — это платный продукт. В сценарии (компонент Web-запроса '''GoogleVoice''') используется пробный ключ, который может быть заблокирован в следствие определенного числа запросов. При тестах максимальное количество запросов не обнаружено. Если вы хотите приобрести платную версию Google Speech API обратитесь в поддержку Google.
+[[Файл:Google Speech API 3.png|center]]
@@ Строка 59: / Строка 63: @@
 Полученный текст передается в переменной '''text''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример  '''Google_Speech_API_main''' для использования сервиса распознавания в главном сценарии.
+[[Файл:Google Speech API 4.png|center]]

Распознавание речи с помощью Google Speech API — различия между версиями

Текущая версия на 11:31, 31 марта 2023

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

IP-платформа Oktell

Примеры использования

Настройка

Инструменты