O inacreditável ponto cego da IA: acerta 70% em receitas e games, mas falha miseravelmente no tópico mais importante
Ela não é confiável para um tipo específico de ajuda
Enquanto a corrida tecnológica eleva a inteligência artificial a patamares de gênio em código e raciocínio, uma nova análise aponta um ponto cego inacreditável: a IA, incluindo os modelos avançados da OpenAI, é ótima para tarefas complexas, mas falha miseravelmente em algo crucial para o dia a dia: compras e consumo.
O benchmark ACE (AI Consumer Index), criado pela Mercor, submeteu os principais modelos de IA (incluindo GPT-5, Gemini e Claude) a 400 tarefas práticas divididas em quatro áreas — compras, comida, DIY (faça-você-mesmo) e games. O resultado é um balde de água fria necessário: a IA é uma assistente geral fantástica, mas um péssimo personal shopper confiável.
Genial, mas desorientada
Apesar da alta performance em outras áreas, o domínio de compras expôs as falhas mais críticas das IAs:
O principal problema é a alucinação, ou seja, a IA inventa informações. Os modelos frequentemente deram links quebrados ou inexistentes em recomendações de produtos e inventaram preços que não batiam com as páginas que usaram como fonte.
Em questões práticas como "essa peça serve no meu PC?" ou compatibilidade de produtos, os erros foram frequentes.
Quando o benchmark exigiu que os modelos comprovassem todas as informações com fontes (grounding), alguns modelos caíram mais de 20 pontos percentuais em precisão.
Mesmo os modelos mais avançados atingiram um pico de apenas 45,4% de acerto no domínio de Compras (o3 Pro), enquanto em áreas menos subjetivas, a precisão foi significativamente maior:...
Matérias relacionadas