O próximo marco para IAs geradoras de vídeo era fazê-las com áudio; o Google conseguiu isso com o Veo 3
O que parecia impossível alguns anos atrás agora é fácil para o Google.
Ótimo dia para o Google. Estamos no meio do I/O 2025, o evento de software mais importante do ano para a empresa americana. Curiosamente, Android é um dos nomes menos comentados: neste ano, a única coisa que importa é IA.
E, relacionado à IA, o Google vem trabalhando há algum tempo em um modelo que permite gerar vídeos por meio de texto. Esse modelo é o Veo , e em sua nova atualização ele é capaz de gerar esses vídeos... com áudio.
Veo 3
O Google agora tem três níveis para sua IA de vídeo generativa. Veo 1, Veo 2 e o novo Veo 3. Sim, são nomes muito mais fáceis do que estamos acostumados . O Veo 3 é o modelo mais potente, capaz de gerar vídeos 4K com compressão cinematográfica avançada. Neste Google I/O, ele ganha um recurso essencial: geração de vídeo com áudio.
De sons ambientes a diálogos
O Google está apostando tudo no Veo 3. Este modelo não só oferece melhor qualidade que o Veo 2: é o único modelo do Google capaz de gerar vídeos com áudio. Por exemplo, se especificarmos no prompt que queremos uma cena urbana, ele será capaz de recriar alguns dos sons correspondentes a ela (pessoas caminhando, trânsito, barulho, etc.).
O Google vai além e promete até mesmo criar diálogos entre personagens. Essa é uma das barreiras definitivas para que a conversão de vídeo em texto se torne praticamente um recurso de ficção científica. Com o Veo 3 será possível fazer tudo.
Melhorias no Veo 2
Embora o Veo 3 seja o protagonista absoluto, o Veo 2 é atualizado com novos recursos. Entre...
Matérias relacionadas