O inacreditável ponto cego da IA: acerta 70% em receitas e games, mas falha miseravelmente no tópico mais importante

Ela não é confiável para um tipo específico de ajuda

Por: Vika Rosa / Xataka

10 dez 2025 - 17h51

(atualizado em 11/12/2025 às 11h21)

Exibir comentários

Enquanto a corrida tecnológica eleva a inteligência artificial a patamares de gênio em código e raciocínio, uma nova análise aponta um ponto cego inacreditável: a IA, incluindo os modelos avançados da OpenAI, é ótima para tarefas complexas, mas falha miseravelmente em algo crucial para o dia a dia: compras e consumo.

O benchmark ACE (AI Consumer Index), criado pela Mercor, submeteu os principais modelos de IA (incluindo GPT-5, Gemini e Claude) a 400 tarefas práticas divididas em quatro áreas — compras, comida, DIY (faça-você-mesmo) e games. O resultado é um balde de água fria necessário: a IA é uma assistente geral fantástica, mas um péssimo personal shopper confiável.

Genial, mas desorientada

Apesar da alta performance em outras áreas, o domínio de compras expôs as falhas mais críticas das IAs:

O principal problema é a alucinação, ou seja, a IA inventa informações. Os modelos frequentemente deram links quebrados ou inexistentes em recomendações de produtos e inventaram preços que não batiam com as páginas que usaram como fonte.

Em questões práticas como "essa peça serve no meu PC?" ou compatibilidade de produtos, os erros foram frequentes.

Quando o benchmark exigiu que os modelos comprovassem todas as informações com fontes (grounding), alguns modelos caíram mais de 20 pontos percentuais em precisão.

Mesmo os modelos mais avançados atingiram um pico de apenas 45,4% de acerto no domínio de Compras (o3 Pro), enquanto em áreas menos subjetivas, a precisão foi significativamente maior:...

Veja mais

Matérias relacionadas

Há anos se fala sobre o alto consumo de água causado pela IA: tudo começou com um livro que exagerou esse aspecto

Um único centro de dados consegue aquecer 20.000 residências: a inovação finlandesa no boom da inteligência artificial

A autorização concedida pelos EUA para que os processadores H200 da Nvidia cheguem à China não é uma concessão, é um plano; eles priorizam o dinheiro em detrimento da concorrência

Fim da ditadura do algoritmo? Instagram lança recurso mais importante que inverte as regras dos Reels

A Valve conseguiu o impossível com jogos para Windows graças ao Proton; agora, eles querem fazer o mesmo com jogos para Android

Comentários (0)

Os comentários são de responsabilidade exclusiva de seus autores e não representam a opinião deste site. Se achar algo que viole os termos de uso, denuncie.

Minha experiência após dois meses com o Galaxy Fold 7: por que não quero mais voltar para um smartphone tradicional

Ucrânia descobriu ponto fraco da Rússia na Crimeia: agora há uma fila de caminhões russos que não consegue avançar

Parece ficção: parques da Disney possuem uma rede de túneis subterrâneos "secretos" e o motivo é mais nobre do que você imagina

O inacreditável ponto cego da IA: acerta 70% em receitas e games, mas falha miseravelmente no tópico mais importante

Ela não é confiável para um tipo específico de ajuda

Minha experiência após dois meses com o Galaxy Fold 7: por que não quero mais voltar para um smartphone tradicional

Ucrânia descobriu ponto fraco da Rússia na Crimeia: agora há uma fila de caminhões russos que não consegue avançar

Parece ficção: parques da Disney possuem uma rede de túneis subterrâneos "secretos" e o motivo é mais nobre do que você imagina

Genial, mas desorientada

Comentários (0)

Confira também:

Mais lidas

Mulher morre após ser jogada sem corda de mais de 40 metros de altura em salto no interior de SP

Saiba quem é a jovem que morreu após ser jogada sem corda em salto de rope jump

Como um nerd de 32 anos virou a maior ameaça à bilionária Globo

Morte em rope jumping: o que se sabe sobre o caso da jovem que foi jogada sem corda de ponte em Limeira

Irmão de jovem que morreu ao ser arremessada sem corda em rope jump publica desabafo: 'Doendo muito'

Frase do dia de Immanuel Kant, filósofo alemão: 'Se você castigar uma criança por ser má e a recompensar por ser boa, ela fará o que é certo apenas pela recompensa'

Amazon afasta narrador Rômulo Mendonça e comentarista após deboche com repórter

Como a tadalafila virou "hype" entre jovens e teve vendas 2.000% maiores em dez anos

Quem é Rômulo Mendonça, narrador afastado pelo Amazon Prime Video após debochar de colega em podcast

Últimas notícias

Recomendado para você