90% da ciência está perdida. Esta nova IA acabou de encontrar

90% da ciência está perdida. Esta nova IA acabou de encontrar

90% da ciência está perdida. Esta nova IA acabou de encontrar

A maioria dos dados científicos nunca atinge todo o seu potencial para impulsionar novas descobertas.

De cada 100 conjuntos de dados produzidos, cerca de 80 permanecem no laboratório, 20 são partilhados mas raramente reutilizados, menos de dois cumprem as normas FAIR e apenas um normalmente conduz a novas descobertas.

As consequências são significativas: progressos mais lentos no tratamento do cancro, modelos climáticos que carecem de provas suficientes e estudos que não podem ser replicados.

Para mudar isso, a editora de ciência aberta Frontiers lançou o Frontiers FAIR² Data Management, descrito como o primeiro serviço de dados de pesquisa abrangente e baseado em IA do mundo. Ele foi projetado para tornar os dados reutilizáveis ​​e devidamente creditados, combinando todas as etapas essenciais – curadoria, verificações de conformidade, formatação pronta para IA, revisão por pares, um portal interativo, certificação e hospedagem permanente – em um processo contínuo. O objetivo é garantir que os atuais investimentos em investigação se traduzam em avanços mais rápidos na saúde, na sustentabilidade e na tecnologia.

FAIR² baseia-se nos princípios FAIR (Encontrável, Acessível, Interoperável e Reutilizável) com uma estrutura aberta expandida que garante que cada conjunto de dados seja compatível com IA e eticamente reutilizável por humanos e máquinas. O sistema FAIR² Data Management é a primeira implementação funcional deste modelo, chegando num momento em que a produção de investigação está a crescer rapidamente e a inteligência artificial está a remodelar a forma como as descobertas são feitas. Transforma princípios de alto nível em infraestrutura real e escalável com impacto mensurável.

Dra. Kamila Markram, cofundadora e CEO da Frontiers, explica:

“Noventa por cento da ciência desaparece no vazio. Com o Frontiers FAIR² Data Management, nenhum conjunto de dados e nenhuma descoberta precisam ser perdidos novamente – cada contribuição pode agora alimentar o progresso, ganhar o crédito que merece e liberar a ciência.”

IA no núcleo

O trabalho que antes exigia meses de esforço manual – desde a organização e verificação de conjuntos de dados até a geração de metadados e resultados publicáveis ​​– agora é concluído em minutos pelo AI Data Steward, desenvolvido pela Senscience, o empreendimento Frontiers por trás do FAIR².

Os pesquisadores que enviam seus dados recebem quatro resultados integrados: um pacote de dados certificado, um artigo de dados revisado por pares e citável, um portal de dados interativo com visualizações e bate-papo de IA e um certificado FAIR². Cada elemento inclui controles de qualidade e resumos claros que tornam os dados mais fáceis de entender para usuários em geral e mais compatíveis entre disciplinas de pesquisa.

Juntos, esses resultados garantem que cada conjunto de dados seja preservado, validado, citável e reutilizável, ajudando a acelerar a descoberta e ao mesmo tempo dando aos pesquisadores o reconhecimento adequado. O Frontiers FAIR² também aumenta a visibilidade e a acessibilidade, apoiando a reutilização responsável por cientistas, decisores políticos, profissionais, comunidades e até sistemas de IA, permitindo à sociedade extrair maior valor do seu investimento na ciência.

Conjuntos de dados piloto emblemáticos

  • Propriedades da variante SARS-CoV-2 — Cobrindo 3.800 variantes de proteínas spike, este conjunto de dados vincula previsões estruturais de AlphaFold2 e ESMFold com dados de ligação e expressão de ACE2. Oferece um recurso poderoso para a preparação para pandemias, permitindo uma compreensão mais profunda do comportamento e da aptidão das variantes.

  • RM de lesão cerebral pré-clínica — Um conjunto de dados harmonizado de 343 exames de ressonância magnética de difusão de quatro centros de pesquisa, padronizados entre protocolos e alinhados para fins de comparabilidade. Ele apoia a descoberta reprodutível de biomarcadores, análise robusta entre locais e avanços na pesquisa pré-clínica de lesões cerebrais traumáticas.

  • Indicadores de Pressão Ambiental (1990-2050) — Combinando dados observados e previsões modeladas em 43 países ao longo de seis décadas, este conjunto de dados rastreia emissões, resíduos, população e PIB. Apoia a avaliação comparativa da sustentabilidade e o planeamento de políticas climáticas com base em evidências.

  • Biodiversidade do Atol Indo-Pacífico — Abrangendo 280 atóis em cinco regiões, este conjunto de dados integra registros de biodiversidade, habitats de recifes, indicadores climáticos e históricos de uso humano. Fornece uma base sem precedentes para a modelização ecológica, a priorização da conservação e a investigação inter-regional sobre ecossistemas insulares vulneráveis.

Os investigadores que testaram os pilotos observaram que o Frontiers FAIR² não só preserva e partilha dados, mas também cria confiança na sua reutilização – através de verificações de qualidade, resumos claros para não especialistas e a fiabilidade para combinar conjuntos de dados entre disciplinas, garantindo ao mesmo tempo que os cientistas recebem crédito.

Todos os conjuntos de dados piloto estão em conformidade com a Especificação Aberta FAIR², tornando-os curados de forma responsável, reutilizáveis ​​e confiáveis ​​para uso humano e de máquinas a longo prazo, para que os dados de hoje possam acelerar as soluções de amanhã para os desafios mais urgentes da sociedade.

Reconhecimento e Reutilização

Cada reutilização multiplica o valor do conjunto de dados original, garantindo que nenhuma descoberta seja desperdiçada, que cada contribuição possa desencadear a próxima descoberta e que os investigadores obtenham reconhecimento pelo seu trabalho.

Sean Hill, cofundador e CEO da Senscience, o empreendimento Frontiers AI por trás do FAIR² Data Management, observa:

“A ciência investe milhares de milhões na geração de dados, mas a maior parte deles é perdida – e os investigadores raramente recebem crédito. Com o Frontiers FAIR², cada conjunto de dados é citado, cada cientista é reconhecido – recompensando finalmente o trabalho essencial de criação de dados. É assim que as curas, as soluções climáticas e as novas tecnologias chegarão à sociedade mais rapidamente – é assim que libertamos a ciência.”

O que os pesquisadores estão dizendo

Ángel Borja, Pesquisador Principal, AZTI, Pesquisa Marinha, Aliança Basca de Pesquisa e Tecnologia (BRTA):

“Recomendo fortemente esse tipo de curadoria de dados e publicação de artigos, porque você pode gerar informações muito rapidamente e é uma formatação útil para qualquer usuário final.”

Erik Schultes, Pesquisador Sênior, Centro Acadêmico de Pesquisa sobre Drogas de Leiden (LACDR); Líder de implementação FAIR, Fundação GO FAIR:

“Frontiers FAIR² capturou perfeitamente os aspectos científicos do projeto.”

Femke Heddema, pesquisadora e gerente de inovação em sistemas de dados de saúde, PharmAccess:

“O Frontiers FAIR² facilita a execução dos princípios FAIR para pesquisadores e implementadores de saúde digital, provando que tornar reutilizáveis ​​conjuntos de dados como o MomCare não precisa ser complexo. Ao permitir dados transparentes, acessíveis e acionáveis, o Frontiers FAIR² abre a porta para novas oportunidades na pesquisa em saúde.”

Dr. Neil Harris, Professor Residente, Departamento de Neurocirurgia, Centro de Pesquisa de Lesões Cerebrais, Universidade da Califórnia, Los Angeles (UCLA):

“A implementação do FAIR² (Fronteiras) pode fornecer uma verificação objetiva dos dados tanto para a falta quanto para a qualidade, o que é útil em muitos níveis. Esses tipos de avaliações imparciais e resumos de dados podem ajudar a compreensão por especialistas fora do domínio para, em última análise, melhorar o compartilhamento de dados. À medida que o campo avança para o uso de big data em subdisciplinas mais díspares, essas verificações e resumos de dados se tornarão cruciais para manter uma boa compreensão de como podemos usar e combinar a infinidade de dados já dados adquiridos em nossas análises atuais.”

Maryann Martone, editora-chefe, Open Data Commons:

“(Frontiers) FAIR² é uma das maneiras mais fáceis e eficazes de tornar os dados FAIR. Cada PI deseja que seus dados sejam localizáveis, acessíveis, comparáveis ​​e reutilizáveis ​​- no laboratório, com colaboradores e em toda a comunidade científica. O verdadeiro gargalo sempre foi o tempo e o esforço necessários. (Frontiers) FAIR² reduz drasticamente essa barreira, colocando dados verdadeiramente FAIR ao alcance da maioria dos laboratórios.”

Vincent Woon Kok Sin, Professor Assistente, Neutralidade de Carbono e Impulso às Mudanças Climáticas, Centro da Sociedade, Universidade de Ciência e Tecnologia de Hong Kong (HKUST):

“(Frontiers) FAIR² torna nosso conjunto global de dados de resíduos mais visível e acessível, ajudando pesquisadores de todo o mundo que muitas vezes lutam com dados escassos e fragmentados. Espero que isso amplie a colaboração e acelere insights para a gestão sustentável de resíduos.”

Dr. Sebastian Steibl, pesquisador de pós-doutorado, Naturalis Biodiversity Center e Universidade de Auckland:

“A verdadeira acessibilidade aos dados vai além do simples upload de planilhas de dados para um repositório. Significa tornar os dados fáceis de visualizar, explorar e compreender sem necessariamente exigir anos de treinamento. A plataforma (Frontiers) FAIR², com um chatbot de IA e exploração visual interativa de dados e ferramentas de resumo, torna nossos dados ambientais e de biodiversidade amplamente acessíveis e utilizáveis ​​não apenas para acadêmicos, mas também para profissionais, legisladores e iniciativas da comunidade local.”

Share this content:

Publicar comentário