Um sistema de Inteligência Artificial (IA) da Microsoft atingiu 80% de precisão em diagnósticos médicos complexos. A marca é quatro vezes maior do que a média de médicos generalistas. O feito marca um novo avanço na jornada rumo à chamada “superinteligência médica”, conceito usado por especialistas para descrever sistemas capazes de ampliar o acesso à saúde e reduzir custos.
Recentemente a companhia testou uma tecnologia chamada Sequential Diagnosis Benchmark (SDBench), uma plataforma interativa que avalia a capacidade de sistemas de IA em realizar diagnósticos médicos complexos. O experimento testou 304 casos clínicos desafiadores, extraídos do prestigiado New England Journal of Medicine (NEJM).
Por trás da SDBench, está o MAI Diagnostic Orchestrator (MAI-DxO), um sistema que orquestra diferentes modelos de linguagem (GPT-4o, Gemini, Claude, Grok e outros) para colaborar como se fossem um painel de especialistas humanos. Nesses casos, tanto médicos quanto modelos de IA começam com um resumo inicial do paciente e precisam iterativamente solicitar informações adicionais, como perguntas e exames, para chegar a um diagnóstico final.
Testes com casos reais
Em testes, o MAI-DxO alcançou 80% de precisão diagnóstica, superando em quatro vezes a média dos médicos generalistas (20%) que participaram do estudo. Além disso, o sistema reduziu os custos dos exames em 20% comparado aos métodos humanos, otimizando o uso de recursos sem comprometer a qualidade do diagnóstico.
Até agora, a avaliação de IA na medicina se baseava principalmente em testes estáticos de múltipla escolha, que não refletem a complexidade da prática clínica real, onde o diagnóstico é um processo iterativo e dinâmico. Com o SDBench, a Microsoft diz que essa limitação é superada, ao simular o raciocínio clínico real, avaliando não só a precisão do diagnóstico, mas também o custo dos exames solicitados.
Contudo, os pesquisadores observaram que os médicos humanos consideraram fatores que os sistemas de IA ainda não contemplam, como a tolerância de um paciente a um procedimento ou a disponibilidade de um instrumento médico específico.
Mesmo sem planos de lançamento anunciados, a iniciativa reforça o movimento das big techs para ocupar um papel cada vez mais relevante no futuro da medicina.