Alerta de ironia: citações alucinadas encontradas em artigos da NeurIPS, a prestigiada conferência de IA
Inicialização de detecção de IA GPTZero digitalizou tudo 4.841 artigos aceito pela prestigiada Conferência sobre Sistemas de Processamento de Informações Neurais (NeurIPS), que aconteceu no mês passado em San Diego. A empresa encontrou 100 citações alucinadas em 51 artigos que foram confirmados como falsos, disse a empresa ao TechCrunch.
Ter um artigo aceito pelo NeurIPS é uma conquista digna de currículo no mundo da IA. Dado que estas são as mentes líderes da pesquisa em IA, pode-se supor que usariam LLMs para a tarefa catastroficamente enfadonha de escrever citações.
Portanto, há muitas advertências com esta descoberta: 100 citações de alucinações confirmadas em 51 artigos não são estatisticamente significativas. Cada artigo tem dezenas de citações. Portanto, entre dezenas de milhares de citações, isto é, estatisticamente, zero.
Também é importante observar que uma citação imprecisa não nega a pesquisa do artigo. Como NeurIPS disse Fortunaque foi o primeiro a relatar a pesquisa do GPTZero: “Mesmo que 1,1% dos artigos tenham uma ou mais referências incorretas devido ao uso de LLMs, o conteúdo dos próprios artigos (é) não necessariamente invalidado.”
Mas, tendo dito tudo isso, uma citação falsa também não é nada. NeurIPS se orgulha de sua “publicação acadêmica rigorosa em aprendizado de máquina e inteligência artificial”, diz. E cada artigo é revisado por várias pessoas que são instruídas a sinalizar alucinações.
As citações também são uma espécie de moeda para os pesquisadores. Eles são usados como uma métrica de carreira para mostrar o quão influente é o trabalho de um pesquisador entre seus pares. Quando a IA os cria, ela diminui seu valor.
Ninguém pode culpar os revisores por não capturarem algumas citações fabricadas por IA, dado o grande volume envolvido. GPTZero também é rápido em apontar isso. O objetivo do exercício era oferecer dados específicos sobre como os resíduos de IA se infiltram através de “um tsunami de submissões” que “sobrecarregou os pipelines de revisão dessas conferências até o ponto de ruptura”, o startup diz em seu relatório. GPTZero ainda aponta para um artigo de maio de 2025 chamado “A crise da revisão por pares da AI Conference” que discutiu o problema em conferências de estreia, incluindo NeurIPS.
Evento Techcrunch
São Francisco
|
13 a 15 de outubro de 2026
Ainda assim, por que os próprios pesquisadores não puderam verificar a precisão do trabalho do LLM? Certamente eles devem saber a lista real de papéis que usaram em seu trabalho.
O que tudo isso realmente aponta é uma grande e irônica conclusão: se os principais especialistas em IA do mundo, com suas reputações em jogo, não conseguem garantir que seu uso de LLM seja preciso nos detalhes, o que isso significa para o resto de nós?
Share this content:



Publicar comentário