A Google DeepMind apresentou o co-clínico de IA em 01 de maio de 2026. Trata-se de uma iniciativa de pesquisa voltada a investigar como sistemas de IA multimodais poderiam apoiar com mais eficiência profissionais de saúde e pacientes. O projeto aborda a crescente pressão sobre os sistemas de saúde no mundo todo para melhorar resultados, reduzir custos e ampliar o acesso ao cuidado, diante de uma projeção de falta de mais de 10 milhões de profissionais de saúde até 2030, segundo a Organização Mundial da Saúde.
O novo sistema pretende explorar um modelo de “cuidado triádico”, no qual um agente de IA atua ao lado de um médico e de um paciente, em vez de substituir o julgamento clínico. A DeepMind afirmou que o objetivo é construir ferramentas capazes de ampliar o alcance dos clínicos, mantendo os médicos no controle das decisões. A empresa enquadrou o esforço como o próximo passo em sua pesquisa de IA médica, após sistemas anteriores como o MedPaLM, que focou em testes de conhecimento médico, e o AMIE, que realizou consultas simuladas em texto.
Um recurso central do co-clínico de IA é sua capacidade de processar mais do que texto. O sistema foi testado com áudio e vídeo ao vivo, permitindo observar sinais físicos como padrão de marcha, ritmo respiratório e mudanças visíveis na pele. Em simulações telemédicas, o modelo conseguiu orientar pacientes em partes de um exame físico e ajudar com tarefas como verificar a técnica do inalador ou auxiliar na identificação de uma lesão no ombro. Essas capacidades sugerem que, no futuro, a IA multimodal pode apoiar consultas remotas em que observação visual e auditiva importam.
A DeepMind destacou controles de segurança embutidos no sistema. O co-clínico de IA utiliza um desenho de agentes duplos, em que um “Planejador” revisa continuamente a interação e verifica se o “Interlocutor” permanece dentro dos limites clínicos. A empresa afirmou que essa estrutura busca reduzir saídas inseguras e melhorar a confiabilidade em contextos médicos, nos quais precisão factual e contenção são essenciais.
A equipe de pesquisa avaliou o sistema de várias formas. Em um teste, ela adaptou a estrutura de segurança NOHARM para medir tanto respostas incorretas quanto falhas em expor informações importantes. Em comparações cegas envolvendo 98 consultas de atenção primária, o sistema registrou zero erros críticos em 97 casos e foi preferido por médicos em relação a outras ferramentas de síntese de evidências. A DeepMind afirmou que isso sugere que o modelo pode ser útil para clínicos que buscam informações clínicas fundamentadas e de alta qualidade.
O estudo também analisou o desempenho do sistema em perguntas relacionadas a medicamentos usando o benchmark OpenFDA RxQA, que foi criado para testar conhecimento e raciocínio sobre drogas e tratamento. Em avaliações abertas, o co-clínico de IA superou outros modelos da fronteira, indicando progresso em uma área especialmente importante para o planejamento do cuidado no dia a dia.
Em simulações voltadas aos pacientes, porém, médicos humanos ainda tiveram desempenho geral melhor. Trabalhando com médicos acadêmicos de Harvard e Stanford, a equipe de pesquisa conduziu um estudo randomizado envolvendo 20 cenários clínicos sintéticos e 10 pacientes-atores médicos. Em mais de 140 áreas avaliadas, os médicos superaram a IA na detecção de sinais de alerta e na condução de exames físicos, mesmo quando o sistema igualou ou superou o desempenho médico em 68 categorias, incluindo triagem. Os resultados sugerem que a ferramenta pode ser mais valiosa como sistema de apoio do que como substituto da expertise clínica.
A DeepMind afirmou que o objetivo mais amplo é desenvolver uma IA capaz de ajudar médicos de maneiras confiáveis, fundamentadas clinicamente e adaptáveis a ambientes reais de cuidado. A empresa continua colaborações de pesquisa em vários países, incluindo Estados Unidos, Índia, Austrália, Nova Zelândia, Singapura e Emirados Árabes Unidos, enquanto trabalha para testar o sistema em contextos de saúde ainda mais diversos.