A IA de vídeo do Google ficou mais poderosa: o que o Gemini Omni promete fazer
Novo modelo permite gerar e editar vídeos a partir de texto, imagens, áudios e outros vídeos, com cenas mais consistentes e som criado pela própria IA
O Google quer dar mais um passo na criação de vídeos com inteligência artificial. A nova aposta da empresa é o Gemini Omni, um modelo capaz de gerar vídeos a partir de diferentes tipos de entrada, como texto, imagem, áudio e até outros vídeos.
A proposta é simples de entender, mas poderosa na prática: permitir que o usuário combine vários elementos em um único comando para criar cenas mais completas, coerentes e realistas.
A seguir, entenda o que é o Gemini Omni, o que ele promete oferecer e como usar a ferramenta dentro do ecossistema do Google.
O que é o Gemini Omni
O Gemini Omni é o novo modelo de IA do Google voltado à criação de vídeos. Com ele, a empresa pretende avançar nesse segmento da mesma forma que chamou atenção na geração de imagens com o Nano Banana.
A primeira versão do modelo é o Gemini Omni Flash, mas a expectativa é que novas versões sejam lançadas no futuro.
O grande diferencial está na capacidade multimodal. Isso significa que o usuário pode combinar imagens, áudios, vídeos e texto em um mesmo prompt para pedir a criação de um vídeo. A partir desses elementos, o Gemini usa seu conhecimento de mundo para gerar cenas mais coerentes e próximas da realidade.
Não é só criar vídeo do zero
O Google não apresenta o Omni apenas como uma ferramenta para gerar vídeos a partir de uma ideia inicial. O modelo também foi pensado para trabalhar sobre cenas já existentes.
Na prática, isso significa que o usuário pode pedir alterações em partes específicas de um vídeo, ...
Matérias relacionadas
Mais de mil comentários criticaram uma imagem de IA. Só que era um Monet verdadeiro
Comentários
Os comentários são de responsabilidade exclusiva de seus autores e não representam a opinião deste site. Se achar algo que viole os termos de uso, denuncie.