PUBLICIDADE

Apple cria IA que edita fotos com base em comando de texto

A Apple lançou uma nova IA capaz de editar fotos com base em pedidos simples e curiosos já podem baixar novidade para testes

9 fev 2024 - 18h01
(atualizado às 22h40)
Compartilhar
Exibir comentários

Uma equipe de pesquisadores da Apple criou um novo modelo de inteligência artificial capaz de cortar, redimensionar, aplicar filtros, modificar objetos inteiros e fazer uma série de edições avançadas em fotos.

Foto: Tim Mossholder/Unsplash / Canaltech

A novidade foi batizada de MLLM-Guided Image Editing (MGIE) e projetada em parceria com a Universidade da Califórnia, nos Estados Unidos. Essa é uma das primeiras iniciativas públicas envolvendo inteligência artificial "moderna" por parte da empresa.

Pedido simples, resultado complexo

Em tese, o MGIE não foge ao que tecnologias semelhantes como DALL-3 e Midjourney já conseguem entregar atualmente. Contudo, o diferencial do modelo de IA da Apple seria a sua alta capacidade de interpretação: ele consegue identificar e executar qualquer pedido do usuário — tornando-se acessível mesmo para quem jamais tocou em um programa de edição.

Explicando melhor, a inteligência artificial da Maçã combina dois diferentes modelos de linguagem multimodal, sendo o primeiro capaz de interpretar solicitações e o segundo voltado para "desvendar" o que a pessoa tem em mente, mesmo que a descrição enviada não tenha sido técnica o suficiente.

Por exemplo, se alguém pedir um "céu mais azul em uma foto", o MGIE pode compreender que o brilho da foto deve ser aumentado. Ou se o usuário solicitar que a foto de uma pizza de calabresa aparente ser mais saudável, a IA pode substituir a carne por uma cobertura de legumes e vegetais.

Exemplos de edições de imagens com base nas capacidades do MGIE (Imagem: Divulgação/Apple)
Exemplos de edições de imagens com base nas capacidades do MGIE (Imagem: Divulgação/Apple)
Foto: Canaltech

Se o resultado não for o desejado, o usuário pode solicitar uma nova interpretação, cabendo à inteligência artificial generativa mexer em outros aspectos da imagem até que chegue em um resultado satisfatório.

Apesar de oferecer tal nível de precisão, a Gigante de Cupertino destaca que os prompts devem ser claros e detalhados, a fim de que as edições cheguem o mais próximo possível do resultado esperado.

Onde baixar o MGIE

Desenvolvedores e entusiastas de tecnologia já pode acessar o MGIE, que foi disponibilizado para download através do GitHub no endereço github.com/apple/ml-mgie. Outro repositório que conta com a novidade da Apple é o Hugging Face Spaces, disponível em huggingface.co.

A Big Tech não deu detalhes quanto à aplicação do novo modelo em seus produtos, abrindo brechas para uma infinidade de especulações —  quem sabe o MGIE não integre o iOS 18 e também venha equipado no iPhone 16 e no recém-lançado Apple Vision Pro. Resta aguardar para saber mais detalhes.

Trending no Canaltech:

Canaltech
Compartilhar
Publicidade
Publicidade