A IA generativa analisa dados médicos mais rapidamente do que equipes de pesquisa humanas

Nova descoberta de previsão fornece resultados chocantemente próximos da realidade

A IA generativa analisa dados médicos mais rapidamente do que equipes de pesquisa humanas

Num primeiro teste real de inteligência artificial na investigação em saúde, cientistas da UC San Francisco e da Wayne State University descobriram que a IA generativa poderia processar enormes conjuntos de dados médicos muito mais rapidamente do que as equipas tradicionais de ciência da computação – e em alguns casos produzir resultados ainda mais fortes. Especialistas humanos passaram meses analisando cuidadosamente as mesmas informações.

Para comparar diretamente o desempenho, os pesquisadores atribuíram tarefas idênticas a grupos diferentes. Algumas equipes confiaram inteiramente na experiência humana, enquanto outras usaram cientistas que trabalhavam com ferramentas de IA. O desafio era prever o nascimento prematuro utilizando dados de mais de 1.000 mulheres grávidas.

Até mesmo uma dupla de pesquisa júnior composta por um aluno de mestrado da UCSF, Reuben Sarwal, e um estudante do ensino médio, Victor Tarca, desenvolveu com sucesso modelos de previsão com suporte de IA. O sistema gerou código de computador funcional em minutos – algo que normalmente levaria várias horas ou até dias para programadores experientes.

A vantagem veio da capacidade da IA ​​de escrever código analítico com base em prompts curtos, mas altamente específicos. Nem todo sistema teve um bom desempenho. Apenas 4 dos 8 chatbots de IA produziram código utilizável. Ainda assim, aqueles que tiveram sucesso não necessitaram de grandes equipes de especialistas para orientá-los.

Devido a essa velocidade, os pesquisadores juniores conseguiram concluir seus experimentos, verificar suas descobertas e enviar seus resultados para um periódico em poucos meses.

“Essas ferramentas de IA podem aliviar um dos maiores gargalos da ciência de dados: construir nossos pipelines de análise”, disse Marina Sirota, PhD, professora de Pediatria e diretora interina do Bakar Computational Health Sciences Institute (BCHSI) da UCSF e investigadora principal do Centro de Pesquisa de Prematuridade March of Dimes da UCSF. “A aceleração não poderia ocorrer mais cedo para os pacientes que precisam de ajuda agora”.

Sirota é co-autor sênior do estudo, publicado em Medicina de relatórios celulares em 17 de fevereiro.

Por que a pesquisa sobre nascimento prematuro é importante

A aceleração da análise de dados poderia melhorar as ferramentas de diagnóstico do nascimento prematuro – a principal causa de morte de recém-nascidos e um dos principais contribuintes para os desafios motores e cognitivos a longo prazo nas crianças. Nos Estados Unidos, cerca de 1.000 bebês nascem prematuramente todos os dias.

Os pesquisadores ainda não entendem completamente o que causa o nascimento prematuro. Para investigar possíveis factores de risco, a equipa de Sirota compilou dados do microbioma de cerca de 1.200 mulheres grávidas, cujos resultados foram acompanhados em nove estudos separados.

“Este tipo de trabalho só é possível com o compartilhamento aberto de dados, reunindo as experiências de muitas mulheres e os conhecimentos de muitos pesquisadores”, disse Tomiko T. Oskotsky MD, codiretora do Repositório de Dados de Nascimento Prematuro March of Dimes, professora associada da UCSF BCHSI e coautora do artigo.

No entanto, analisar um conjunto de dados tão vasto e complexo revelou-se um desafio. Para resolver isso, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Dialogue on Reverse Engineering Assessment and Methods).

Sirota co-liderou um dos três desafios de gravidez DREAM, concentrando-se especificamente nos dados do microbioma vaginal. Mais de 100 equipes em todo o mundo participaram, desenvolvendo modelos de aprendizado de máquina projetados para detectar padrões ligados ao nascimento prematuro. A maioria dos grupos concluiu o seu trabalho dentro do período de competição de três meses. No entanto, foram necessários quase dois anos para consolidar as descobertas e publicá-las.

Testando IA em dados de gravidez e microbioma

Curioso para saber se a IA generativa poderia encurtar esse cronograma, o grupo de Sirota fez parceria com pesquisadores liderados por Adi L. Tarca, PhD, co-autor sênior e professor do Centro de Medicina Molecular e Genética da Wayne State University em Detroit, MI. Tarca liderou os outros dois desafios DREAM, que se centraram na melhoria dos métodos de estimativa do estado da gravidez.

Juntos, os pesquisadores instruíram oito sistemas de IA a gerar algoritmos de forma independente usando os mesmos conjuntos de dados dos três desafios DREAM, sem codificação humana direta.

Os chatbots de IA receberam instruções cuidadosamente escritas em linguagem natural. Assim como o ChatGPT, os sistemas foram guiados por instruções detalhadas projetadas para orientá-los na análise dos dados de saúde de maneira comparável aos participantes originais do DREAM.

Os seus objectivos reflectiam os desafios anteriores. Os sistemas de IA analisaram dados do microbioma vaginal para identificar sinais de parto prematuro e examinaram amostras de sangue ou de placenta para estimar a idade gestacional. A datação da gravidez é quase sempre uma estimativa, mas determina o tipo de cuidado que as mulheres recebem à medida que a gravidez avança. Quando as estimativas são imprecisas, a preparação para o trabalho torna-se mais difícil.

Os pesquisadores então executaram o código gerado pela IA usando os conjuntos de dados DREAM. Apenas 4 das 8 ferramentas produziram modelos que correspondiam ao desempenho das equipas humanas, embora em alguns casos os modelos de IA tenham um desempenho melhor. Todo o esforço generativo de IA – desde o início até a apresentação de um artigo – levou apenas seis meses.

Os cientistas enfatizam que a IA ainda requer uma supervisão cuidadosa. Estes sistemas podem produzir resultados enganosos e a experiência humana continua a ser essencial. No entanto, ao classificar rapidamente enormes conjuntos de dados de saúde, a IA generativa pode permitir que os investigadores gastem menos tempo a resolver problemas de código e mais tempo a interpretar resultados e a fazer perguntas científicas significativas.

“Graças à IA generativa, os pesquisadores com experiência limitada em ciência de dados nem sempre precisarão formar colaborações amplas ou passar horas depurando código”, disse Tarca. “Eles podem se concentrar em responder às questões biomédicas certas.”

Autores: Os autores da UCSF são Reuben Sarwal; Claire Dubin; Sanchita Bhattacharya, MS; e Atul Butte, MD, PhD. Outros autores são Victor Tarca (Huron High School, Ann Arbor, MI); Nikolas Kalavros e Gustavo Stolovitzky, PhD (Universidade de Nova York); Gaurav Bhatti (Universidade Estadual Wayne); e Roberto Romero, MD, D(Med)Sc (Instituto Nacional de Saúde Infantil e Desenvolvimento Humano (NICHD)).

Financiamento: Este trabalho foi financiado pelo March of Dimes Prematurity Research Center da UCSF e pelo ImmPort. Os dados utilizados neste estudo foram gerados em parte com o apoio do Departamento de Pesquisa em Gravidez do NICHD.

Share this content:

Publicar comentário