Корпорация продемонстрировала ПО, которое может переводить мандаринское наречие на английский язык в режиме реального времени, сохраняя при этом голос диктора - волшебный модуль перевода из Star Trek стал чуточку ближе.
Программа работает следующим образом: сначала распознаются отдельные слова, затем происходит их перевод и упорядочивание в связанные предложения, и в конце используются возможности ПО синтеза речи, способного подражать голосу диктора.
"Нам потребовалась система перевода текста в речь, которую исследователи нашей компании разработали, используя нарезку речи коренного жителя Китая длиной в несколько часов и характеристики моего собственного голоса, которые они получили из данных, содержащих около одного часа моей записанной английской речи" - рассказывает глава отдела исследований Рик Рашид (Rick Rashid). Кроме того, он пояснил, что существует некий процент ошибок, который стал равен 1 слову к 7-8 произнесенным. Конечно, система не идеальна, но в отличие от предыдущих попыток, дававших около 30% ошибок, это громадный прогресс.
"Да, мы все еще далеки от идеала, но это одно из самых знаменательных шагов в точности, которое мы достигли со времени появления скрытой Марковской модели в 1979 году. Как только мы добавим еще больше данных для обучения системы, вполне возможно, что результаты превзойдут наши ожидания" - добавляет Рашид.
Рик Рашид представил данную технологию на презентации в Китае еще в прошлом месяце. "Хотя это было и ограниченное тестирования, эффект был потрясающий, публика просто ожила во время демонстрации. Когда я говорил по-английски, система автоматически объединяла все лежащие в ее основе технологии, проделывала трудоемкие расчеты и потом произносила китайскую речь моим голосом."
Google уже давно работает над системой автоматического перевода, так же как AT&T и многие университеты. Тем не менее, подобные системы чаще выдают голосовой перевод не пользовательским голосом, а "машинным", который звучит довольно необычно.
Данный прототип, по словам Рика Рашида, является только началом. "Может нам и не придется ждать 22 века для создания рабочего эквивалента универсального переводчика из Star Trek. Также мы вполне можем надеется, что барьеры недопонимания между людьми различных языков групп будут так же преодолены."
Microsoft продемонстрировала систему голосового перевода в реальном времени
Корпорация продемонстрировала ПО, которое может переводить мандаринское наречие на английский язык в режиме реального времени, сохраняя при этом голос диктора - волшебный модуль перевода изТакже по теме: