Translatotron é o tradutor da Google que imita a voz do usuário
Utilizando IA, a tecnologia consegue traduzir e falar em tempo real, adotando aspectos da voz humana...
A Google anunciou em seu blog de inteligência artificial o Translatotron, uma tecnologia que permite fazer traduções em tempo real e consegue imitar a voz humana. Segundo a companhia, a novidade é o primeiro sistema de ponta a ponta capaz de fazer traduções diretamente por áudio para que duas pessoas consigam manter uma conversa em idiomas diferentes.
A tecnologia de tradução em tempo real não é algo novo e a equipe do Google já vem trabalhando em ferramentas do tipo há tempos, inclusive com a Google Assistente, mas a empresa adicionou um grande diferencial no Translatotron: o programa capta a sua voz e consegue imitá-la falando outro idioma.
Uma nova abordagem
Normalmente, os sistemas de tradução utilizam um sistema de cascata que funciona em três passos: transformar a fala em texto, traduzir para outro idioma e, depois, transformar a sentença novamente em áudio. O objetivo do Translatotron é deixar esse processo mais simples e próximo da voz do usuário.
Como trabalha diretamente com a voz, o Translatotron consegue fazer a tradução sem precisar converter o conteúdo da mensagem para o texto. Além disso, graças a captação de som, a ferramenta também consegue manter trejeitos e aproximar o conteúdo final da voz do usuário, como mostram algumas amostras publicadas no site da Google.
No momento, a nova tecnologia de tradução não conta com tanta qualidade como as soluções convencionais. Ainda assim, como faz uso de inteligência artificial, a tendência é que a novidade se torne mais potente com o passar do tempo.
"Esperamos que este trabalho possa servir como ponto de partida para pesquisas futuras sobre sistemas de tradução de voz para fala de ponta a ponta", explicam os engenheiros do Google IA no post de anúncio do projeto. Agora, o negócio é esperar para que a tecnologia continue evoluindo e seja implementada nos serviços da empresa, como o Google Tradutor e o Interpreter Mode, ferramenta da Google Assistente que funciona em 27 idiomas diferentes.