Google использует искусственный интеллект для распознания голоса

🕛 08.10.2012, 16:28

Американская корпорация применяет нейронные сети для более точного определения некорректно произносимых слов.
Как передает Technology Review, корпорация Google намерена использовать технологии нейронных сетей для работы службы распознания голоса. Отметим, что еще летом компания оформила новый этап развития искусственного интеллекта, представив систему, способную узнавать животных и людей в YouTube.
Спонсируемый Google исследовательский центр X Lab создал нейронною сеть из миллиарда связей, которые использовались для обработки 10 миллионов изображений размером в 200x200 пикселей. Все эти изображения были взяты из YouTube, и система больше 3 дней обрабатывала полученные данные, распознавая при этом человеческие лица и тела. Несмотря на относительно низкую точность полученной информации – всего 15,8% – полученный результат стал значительным событием в данном поле.
По словам одного из разработчиков новой службы Винсента Ванхаука (Vincent Vanhoucke), система разбирает некорректно произнесенные слова на 20% - 25% лучше, чем ее аналоги. Таким образом, служба обеспечит меньшее количество ошибок при диктовке, в том числе, если слова будут произноситься не носителями языка. Данная служба дает очень широкие возможности, так как теперь, например, аналитическим компаниям будет легче обрабатывать звуковую речь, используя компьютерные технологии.
Пока что данная реализация искусственного интеллекта от Google принимает информацию только по английски, но компания намерена научить его и другим языкам. Предполагается, что после улучшения голосовых технологий американский гигант задействует нейронную сеть для улучшения функционала поиска по картинкам, а также при работе аппаратных устройств, в том числе «умных» очков.