Google anuncia gerador de vídeo por IA e outras novidades: confira

Google I/O 2024 traz novidades sobre Gemini, a inteligência artificial da empresa

14 mai 2024 - 14h23
(atualizado às 16h39)
Sundar Pichai, CEO do Google, no Google I/O 2024
Sundar Pichai, CEO do Google, no Google I/O 2024
Foto: Reprodução/YouTube/Google

O Google apresentou, nesta terça-feira (14), todas as novidades e lançamentos da plataforma para 2024. O evento Google I/O 2024 foi transmitido ao vivo e os principais anúncios incluíram as atualizações do Gemini, a inteligência artificial da empresa. 

As atualizações elaboradas por inteligência artificial, inclusive, foram o maior destaque da edição de 2024. Já que a plataforma anunciou recursos de IA para fotos, vídeos e músicas

Publicidade

Apesar de ser focado aos desenvolvedores, a atualização dos recursos e serviços da plataforma impactam também os consumidores. 

"1,5 milhão de desenvolvedores usam modelos Gemini nas ferramentas do Google, depuram códigos, obtêm novos insights e criam a “próxima geração de aplicativos de IA”, disse Sundar Pichai, CEO do Google. 

Ask Photos

Segundo Pichai, 6 bilhões de fotos são baixadas todos os dias no Google Fotos. Com isso, um dos recursos anunciados foi o "Ask Photos", que utiliza a inteligência artificial para localizar fotos específicas na sua galeria. 

O novo recurso torna mais fácil pesquisar fotos e vídeos com a ajuda dos modelos Gemini. Você pode, por exemplo, perguntar ao celular "qual a placa do meu carro", e imediatamente o recurso trará uma foto da placa do seu veículo. 

Publicidade

"O Google Fotos pode responder a uma pergunta como “mostre-me como a natação da minha filha progrediu” e pesquisa fotos e cria uma coleção com o Gemini", exemplificou o CEO no evento. 

Google DeepMind

O evento apresentou o recurso Imagen 3, vinculado ao Google DeepMind o modelo de geração de imagens do Google.

"Ele entende a forma como as pessoas escrevem, cria imagens mais fotorrealistas e é nosso melhor modelo para renderização de texto", afirmou a plataforma no evento. 

O Imagen 3 é capar de produzir visuais com detalhes incríveis, iluminação realista e menos artefatos que distraem. "De esboços rápidos a imagens de alta resolução".

Google anuncia gerador de vídeo por IA
Foto: Google

O Veo é capaz de criar vídeos a partir de comandos de voz. Ela é parecida com o Sora, anunciada pela OpenAI em fevereiro, mas por enquanto está disponível em fase experimental apenas nos Estados Unidos.

Publicidade

Com apenas um prompt de texto, imagem ou vídeo, os novos recursos do Google permitem criar e editar vídeos HQ de mais de 60 segundos em diferentes estilos visuais.

"Entre na lista de espera do Labs para experimentar nossa nova ferramenta experimental, VideoFX", informou o Google. 

"Nunca aposte contra @Google ! Eles acabaram de abandonar um concorrente do Sora. 1080p, vídeos com mais de um minuto de duração e qualidade impecável", escreveu um usuário no X. Veja: 

Essas colaborações também estão informando o desenvolvimento de tecnologias musicais generativas, incluindo Lyria , o modelo mais avançado do Google para geração musical de IA.

Publicidade

"Estas ferramentas foram concebidas para abrir um novo parque de criatividade, permitindo às pessoas criar novas secções instrumentais a partir do zero, transformar o som de novas formas e muito mais". 

Gemini 1.5 Flash

O Google I/O 2024 apresentou o Gemini 1.5 Flash, um modelo mais leve em comparação com o Pro, projetado para ser rápido e econômico. "Você pode usar ambos com até 1 milhão de tokens", informou o CEO do Google DeepMind, Demis Hassabis.

"O Gemini 1.5 Flash foi projetado para ser executado em grande escala", incluiu. 

O Gemini 1.5 Flash integra-se às categorias Ultra, Pro e Nano. Segundo o Google, o Gemini 1.5 Flash é indicado para fazer resumos, interagir em aplicativos de mensagens, criar legendas para imagens e vídeos e extrair documentos de arquivos.

A tecnologia foi liberada para usuários do plano Gemini Advanced em 35 idiomas, incluindo o português.

Publicidade

Astra

Astra é “um agente universal de IA que pode ser verdadeiramente útil na vida cotidiana”. O Google anunciou o projeto Astra, a resposta do Google às atualizações do ChatGPT, da OpenAI, anunciadas recentemente.

Este pretende ser um agente universal para a vida cotidiana e a razão pela qual a Gemini será multimodal, disse Demis ao apresentar o projeto. "O ritmo e a qualidade da interação parecem mais 'naturais' com o Astra".

Android

"Com bilhões de usuários do Android em todo o mundo, estamos entusiasmados em integrar o Gemini mais profundamente à experiência do usuário", disse Sundar Pichai.

No evento, o CEO do Google afirmou que a empresa incorporou modelos Gemini no Android, incluindo o Gemini Nano com Multimodalidade, que processa texto, imagens, áudio e fala para desbloquear novas experiências enquanto mantém as informações privadas em seu dispositivo. 

Publicidade

Sameer Samat, presidente do ecossistema Android falou de um dos novos recursos, o Circle to Search, que pode ajudar os estudantes com a lição de casa.

"Quando os alunos circulam um prompt, eles recebem instruções passo a passo para resolver uma série de questões de física e matemática sem sair de sua folha de informações digital ou plano de estudos. Ainda este ano, o Circle to Search poderá ajudar a resolver problemas ainda mais complexos envolvendo fórmulas simbólicas, diagramas e gráficos", explicou Samat.

Mais proteção

O Android também irá receber um recurso de detecção de chamadas fraudulentas com tecnologia de IA. O Google afirma que as novas proteções utilizam Gemini Nano e que compartilhará mais detalhes “ainda este ano”. 

O recurso utiliza o Gemini Nano – uma versão reduzida do modelo de linguagem Gemini — pode ser executado localmente e offline para procurar linguagem fraudulenta e outros padrões de conversa normalmente associados a golpes.

Os usuários receberão alertas em tempo real durante as chamadas em que esses sinais de alerta estiverem presentes. 

Alguns exemplos do que poderia desencadear esses alertas incluem ligações de “representantes bancários” que fazem solicitações que os bancos reais provavelmente não farão, como solicitar informações pessoais, como senhas de cartão, solicitar pagamentos por meio de cartões-presente ou pedir aos usuários que façam uma transferência com urgência. 

Publicidade
Google terá dispositivo para detectar golpes
Foto: Google
Fonte: Redação Byte
TAGS
Curtiu? Fique por dentro das principais notícias através do nosso ZAP
Inscreva-se