Выделение смысла с помощью Yandex SpeechKit Cloud
Наверх [Oktell 2.7+]
Содержание
Введение
Yandex SpeechKit Cloud — это облачный сервис, открывающий разработчикам доступ к речевым технологиям Яндекса. В этой статье мы поговорим про выделение смысловых структур из текста.
Технология выделения смысловых объектов позволяет позволяет найти смысловые объекты в тексте и получить от сервера размеченный распознанный текст. С помощью сервиса возможно анализировать контекст фразы, к примеру, система понимает, что во фразе "Позвони Владимиру" имеется ввиду человек, а во фразе "Поехали во Владимир" - город. В системе Oktell сервис удобно применять для анализа распознанных голосовых выражений и электронных писем.
Для иллюстрации полезности сервиса рассмотрим задачу голосового управления в IVR-меню. Представим, что в компанию позвонил клиент, который хочет соединиться с отделом технической поддержки. После того как, система спросит клиента с кем его соединить, она отправит фразу на распознавание и получит конечный текст, который потребуется проанализировать. Давайте подумаем, какие фразы мы можем получить:
- Соедините меня с отделом техподдержки
- Мне нужны инженеры
- У меня не работает программа, хочу услышать программистов
Даже если перебирать все слова в полученном выражении, мы уже получим 7 вариантов одного слова в различных падежах или модальностях. Например, глагол "позвонить" и "позвони" - одно и то же. Фактически получится, что разработка сценария приведет к перебору ключевых слов или фраз, на которые стоит реагировать. С помощью выделения смысла мы как минимум можем получить все существительные в именительном падеже, глаголы в инфинитиве и тем самым абстрагироваться от модальности. Если в исходной фразе имеется адрес, то сервис определяет номер квартиры, название улицы и города. Это значительно облегчает разра
На момент написания статьи сервис умеет находить такие объекты, как
- Дата и время.
- Фамилия, имя и отчество.
- Адреса
- Морфемы - существительные преобразуются в именительный падеж, глаголы в инфинитив
Таким образом, что сказал абонент и проанализировать конкретное выражен Это облегчает задачу построения логики голосового управления.
Технология позволяет найти и разметить смысловые объекты в тексте и получить от сервера размеченный распознанный текст в виде JSON-структуры.
Документация по API выделения смысла Yandex SpeechKit доступна на сайте https://tech.yandex.ru/speechkit/cloud/doc/dg/concepts/speechkit-dg-nlu-docpage/