"Яндекс" запустил облачный сервис распознавания речи

Новый сервис SpeechKit Cloud от Яндекса позволит разработчикам добавлять функцию распознавания голоса в приложения для мобильных устройств, автомобильных навигаторов, систем телефонии и т. д

Новый сервис SpeechKit Cloud от "Яндекса" позволит разработчикам добавлять функцию распознавания голоса в приложения для мобильных устройств, автомобильных навигаторов, систем телефонии и т. д. В компании утверждают, что распознавание запроса выполняется за одну секунду.

Компания «Яндекс» объявила о запуске облачного сервиса SpeechKit Cloud. С его помощью разработчики смогут добавлять функцию распознавания речи в различные программы, сервисы и устройства.

Сервис может быть полезен: для десктопов и ноутбуков (голосовой ввод и голосовые интерфейсы в приложениях и играх), для автомобилей (голосовое управление функциональностью автомобиля, навигационными и мультимедийными системами), в телефонии (интерактивное голосовое меню, автоматизация телемаркетинга и информирования), в медицине (протоколирование приема пациента, протоколирование операций) и пр.

«Облачный сервис распознавания речи «Яндекса» уже используют компания Oktell, выпускающая программное обеспечение для колл-центров, и Cubic Robotics — разработчик домашнего робота Cubic. Робот понимает заданные голосом вопросы и отвечает на них, а система Oktell распознает речь звонящего в колл-центр человека и соединяет его с нужным специалистом», — рассказали в компании.

SpeechKit Cloud понимает русский и турецкий языки. Качество распознавания на русском языке составляет: диктовка текстов — 82%, короткие запросы из 3–5 слов на любую тематику — 85% и геозависимые запросы — 95%.

Обработка голосовых запросов производится на серверах «Яндекса». Распознавание происходит в реальном времени одновременно с передачей звуковых данных. В компании уверяют, что распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа.

Доступ к SpeechKit Cloud организован с помощью HTTP API. В компании объяснили, что такой способ является для разработчиков наиболее простым. «Чтобы интегрировать эту технологию «Яндекса», необходимо прочитать всего пару страниц документации и написать несколько строчек кода в своем продукте», — пояснили CNews в пресс-службе.

Разработчики могут бесплатно использовать SpeechKit Cloud в течение месяца. По окончании пробного периода стоимость будет зависеть от количества запросов.

Как рассказали в «Яндексе», средняя стоимость использования SpeehKit Cloud для 1 тыс. голосовых запросов — $5. При этом некоторым категориям клиентов в компании готовы предоставлять доступ бесплатно. К таким клиентам, например, относятся некоммерческие образовательные и медицинские организации.

В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую «Яндекс» запустил в 2013 г. Технология базируется на акустических и языковых моделях, построенных с использованием нейронных сетей. Сейчас Yandex SpeechKit используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов.

Как пояснили CNews в «Яндексе», SpeechKit Mobile SDK предназначен для добавления функции распознавания в приложения для iOS, Android и Windows Phone. Что же касается SpeechKit Cloud, то новый сервис разрешает выполнить интеграцию практически в любую систему. Оба проекта от начала до конца были разработаны в стенах российской компании.

Добавим, что сервис, подобный Yandex SpeechKit, есть и у Google. Он называется Speech API и доступен только в Android.

✆ Читать IT-новости в Telegram

Также по теме: