Colocaram os 21 chatbots de IA mais populares à prova para diagnóstico diferencial; falharam mais vezes do que em um estande de tiro de parque de diversões
A inteligência artificial está sendo cada vez mais utilizada na medicina, tanto para consultas domiciliares quanto em ambientes profissionais; Com relação aos dados, os resultados são bons, mas para diagnósticos precoces, são péssimos
Texto original de Alejandro Alcolea
Adoro a série "House". As histórias de fundo não me interessam nem um pouco, mas o processo de diagnóstico diferencial — apesar de todos os seus aspectos cinematográficos — me deixa louco. Essa capacidade de descartar doenças que poderiam explicar os mesmos sintomas para chegar ao diagnóstico mais provável me parece mágica.
Bem, colocaram os 21 chatbots de IA mais populares para trabalhar nesse diagnóstico diferencial, e o resultado é claro.
É mais impreciso do que um estande de tiro de parque de diversões.
Em resumo
O Mass General Brigham não é um hospital comum. É uma rede de médicos e hospitais americanos sem fins lucrativos, incluindo duas das instituições de ensino médico mais prestigiadas do país.
De janeiro a dezembro de 2025, um grupo de pesquisadores da instituição testou 21 chatbots de IA, incluindo Claude 4.5 Opus, DeepSeek, Gemini 3.0 Pro, GPT-5 e Grok 4, em dezenas de casos clínicos para determinar sua precisão no diagnóstico precoce.
As informações são extremamente básicas, mas são exatamente o que os profissionais têm à disposição para fazer diagnósticos diferenciais, e o objetivo final é avaliar as capacidades de raciocínio clínico desses modelos de linguagem de última geração para verificar se eles podem ser aliados na prática clínica.
A resposta é não. Embora os modelos otimizados para raciocínio tenham alcançado pontuações muito mais altas do que os mais simples, como o Gemini 1.5 Flash, a conclusão é que os modelos de linguagem ...
Matérias relacionadas
A vez em que Steve Jobs comprou 7.000 computadores Apple Lisa para enterrá-los em um aterro
Abriram-se as porteiras: já temos o primeiro malware desenvolvido com IA
Comentários
As opiniões expressas nos comentários são de responsabilidade exclusiva de seus autores e não representam a opinião do Terra.