O Google quer dar mais um passo na criação de vídeos com inteligência artificial. A nova aposta da empresa é o Gemini Omni, um modelo capaz de gerar vídeos a partir de diferentes tipos de entrada, como texto, imagem, áudio e até outros vídeos.
A proposta é simples de entender, mas poderosa na prática: permitir que o usuário combine vários elementos em um único comando para criar cenas mais completas, coerentes e realistas.
A seguir, entenda o que é o Gemini Omni, o que ele promete oferecer e como usar a ferramenta dentro do ecossistema do Google.
O que é o Gemini Omni
O Gemini Omni é o novo modelo de IA do Google voltado à criação de vídeos. Com ele, a empresa pretende avançar nesse segmento da mesma forma que chamou atenção na geração de imagens com o Nano Banana.
A primeira versão do modelo é o Gemini Omni Flash, mas a expectativa é que novas versões sejam lançadas no futuro.
O grande diferencial está na capacidade multimodal. Isso significa que o usuário pode combinar imagens, áudios, vídeos e texto em um mesmo prompt para pedir a criação de um vídeo. A partir desses elementos, o Gemini usa seu conhecimento de mundo para gerar cenas mais coerentes e próximas da realidade.
Não é só criar vídeo do zero
O Google não apresenta o Omni apenas como uma ferramenta para gerar vídeos a partir de uma ideia inicial. O modelo também foi pensado para trabalhar sobre cenas já existentes.
Na prática, isso significa que o usuário pode pedir alterações em partes específicas de um vídeo, ...
Matérias relacionadas
Mais de mil comentários criticaram uma imagem de IA. Só que era um Monet verdadeiro