PUBLICIDADE

Diga 'Oi', ouça 'Hi': técnica faz voz do usuário falar outros idiomas

9 nov 2012 08h24
| atualizado às 09h32
Publicidade

A Microsoft publicou na última quinta-feira um vídeo em que mostra uma tecnologia de tradução capaz de não só traduzir as falas de um usuário numa transcrição em legenda, como também reproduzir a tradução em áudio, num novo idioma, com a própria voz original.

Sistema desenvolvido em parceria com a Microsoft pode facilitar comunicação na internet
Sistema desenvolvido em parceria com a Microsoft pode facilitar comunicação na internet
Foto: Youtube.com / Reprodução

Segundo Rick Rashid, diretor de pesquisa da Microsoft, a técnica utilizada chama-se Deep Neural Networks - ela segue o modelo de comportamento do cérebro humano, e permitiu aos pesquisadores treinar o reconhecimento com um critério melhor do que métodos anteriores.

"Nós fomos capazes de reduzir a taxa de erro por fala em 30% na comparação com as técnicas usadas antes. Isso significa que em vez de ter uma palavra errada em cada quatro ou cinco, a taxa é de uma em cada sete ou oito", disse.

Numa primeira etapa, o computador "entendeu" a voz do usuário e a converteu em um texto escrito. Depois, o texto escrito foi traduzido para outra língua. No passo seguinte, uma gravação de uma hora da voz do usuário foi utilizado para reproduzir o texto traduzido em áudio, fazendo a voz do interlocutor "falar" no novo idioma.

No vídeo, um executivo apresenta a tecnologia com uma tradução do inglês para o mandarim. Ao final da apresentação, por exemplo, ao agradecer - thank you, na sua própria voz, em mandarim, se ouviu xiè xiè.

Fonte: Terra
Publicidade