Программа работает следующим образом: сначала распознаются отдельные слова, затем происходит их перевод и упорядочивание в связанные предложения, и в конце используются возможности ПО синтеза речи, способного подражать голосу диктора.
"Нам потребовалась система перевода текста в речь, которую исследователи нашей компании разработали, используя нарезку речи коренного жителя Китая длиной в несколько часов и характеристики моего собственного голоса, которые они получили из данных, содержащих около одного часа моей записанной английской речи" - рассказывает глава отдела исследований Рик Рашид (Rick Rashid). Кроме того, он пояснил, что существует некий процент ошибок, который стал равен 1 слову к 7-8 произнесенным. Конечно, система не идеальна, но в отличие от предыдущих попыток, дававших около 30% ошибок, это громадный прогресс.
"Да, мы все еще далеки от идеала, но это одно из самых знаменательных шагов в точности, которое мы достигли со времени появления скрытой Марковской модели в 1979 году. Как только мы добавим еще больше данных для обучения системы, вполне возможно, что результаты превзойдут наши ожидания" - добавляет Рашид.
Рик Рашид представил данную технологию на презентации в Китае еще в прошлом месяце. "Хотя это было и ограниченное тестирования, эффект был потрясающий, публика просто ожила во время демонстрации. Когда я говорил по-английски, система автоматически объединяла все лежащие в ее основе технологии, проделывала трудоемкие расчеты и потом произносила китайскую речь моим голосом."
Google уже давно работает над системой автоматического перевода, так же как AT&T и многие университеты. Тем не менее, подобные системы чаще выдают голосовой перевод не пользовательским голосом, а "машинным", который звучит довольно необычно.
Данный прототип, по словам Рика Рашида, является только началом. "Может нам и не придется ждать 22 века для создания рабочего эквивалента универсального переводчика из Star Trek. Также мы вполне можем надеется, что барьеры недопонимания между людьми различных языков групп будут так же преодолены."
