O que motivou o ArXiv a proibir artigos com texto gerado por IA?

A decisão foi tomada devido ao aumento de submissões que continham referências falsas e trechos de chatbot inseridos sem revisão humana, o que comprometia a integridade científica do repositório.

Pesquisadores podem usar IA em suas pesquisas?

Sim, desde que o uso ocorra de forma responsável e com curadoria humana. O ArXiv proíbe apenas o envio de textos não verificados ou completamente automatizados.

Qual é a punição prevista pelas novas regras?

Autores que enviarem artigos com texto gerado por IA serão banidos por até um ano. Após o período, novas submissões só serão aceitas se o artigo tiver passado por revisão por pares.

O que é um preprint e por que o ArXiv é importante?

Preprints são versões preliminares de estudos científicos publicadas antes da revisão por pares. O ArXiv é um dos principais repositórios desse tipo, favorecendo o acesso aberto ao conhecimento.

Ilustração sobre inteligência artificial no ambiente científico

ArXiv vai banir autores de artigos com texto gerado por IA

18 de maio de 2026 Diogo Fernando ia 6 min Leitura

O ArXiv, um dos maiores repositórios de pesquisas científicas do mundo, anunciou uma nova política rigorosa contra o uso indevido de inteligências artificiais generativas na produção de artigos acadêmicos. Autores que enviarem textos contendo trechos gerados por IA sem revisão humana poderão ser banidos por até um ano. A decisão surge após o aumento de submissões com referências falsas, citações inexistentes e comentários automáticos de chatbots inseridos diretamente nos manuscritos.

Nova política de moderação e punições

A decisão foi comunicada publicamente pelo presidente da seção de ciência da computação do ArXiv, Thomas Dietterich, por meio de uma publicação na plataforma X (antigo Twitter). Segundo ele, a medida busca proteger a integridade científica do acervo, após o repositório detectar casos frequentes de materiais totalmente ou parcialmente gerados por linguagem natural automatizada sem curadoria humana.

“Não estamos proibindo o uso de IA na pesquisa, mas sim o envio de textos que contenham trechos claramente produzidos por modelos sem verificação humana”, afirmou Dietterich. Ele também destacou que as sanções se aplicam mesmo na primeira infração, desde que as evidências sejam incontestáveis.
Thomas Dietterich, ArXiv/X

Os autores punidos poderão reenviar seus trabalhos apenas após o período de suspensão, contanto que o artigo já tenha passado por publicação ou revisão por pares reconhecida. Caso o conteúdo automatizado seja detectado novamente, a punição poderá ser ampliada.

Referências falsas e “comentários de chatbot” preocupam o ArXiv

O principal problema identificado pela equipe editorial do ArXiv é o uso incorreto dos modelos de linguagem grandes (LLMs), que muitas vezes geram citações inventadas, dados inexistentes e parágrafos que simulam coerência, mas distorcem a informação acadêmica. Segundo Dietterich, há casos em que o próprio chatbot deixou mensagens explicativas dentro do corpo do texto — um sinal claro de uso indevido.

Mensagem oculta para IA em artigo acadêmico no ArXiv — Casos de mensagens ocultas em artigos tentaram manipular IAs revisoras — imagem: Kaori Yuzawa

Isso não significa que o uso de inteligência artificial está totalmente proibido. O foco das novas regras é punir abusos que violem a integridade científica, e não inibir o uso da tecnologia como ferramenta de apoio à pesquisa — como revisão gramatical, tradução ou sumarização técnica supervisionada por humanos.

O que é o ArXiv e por que ele é essencial para a ciência

Fundado em 1991 e atualmente administrado pela Cornell University, o ArXiv atua como repositório de preprints — versões preliminares de artigos científicos que ainda não passaram por revisão formal de pares. A plataforma é central para comunidades de física, matemática, computação e biologia, permitindo o acesso aberto a novos estudos antes da publicação tradicional.

No entanto, a facilidade de publicação também tornou o repositório vulnerável ao aumento de conteúdos automatizados. Em 2025, a equipe já havia bloqueado temporariamente novas submissões na área de ciência da computação após detectar uma enxurrada de textos criados por modelos generativos.

Além disso, desde janeiro de 2026, autores iniciantes precisam da recomendação de um pesquisador experiente para poder submeter seu primeiro estudo, reforçando o esforço do ArXiv em manter a qualidade de suas publicações.

Estudos revelam aumento de citações inventadas

Segundo dados divulgados pelo veículo 404 Media, pesquisadores da Universidade de Columbia analisaram mais de 2,5 milhões de artigos biomédicos, constatando uma alta expressiva no número de referências falsas nos últimos três anos. Entre 2023 e 2025, uma em cada 458 publicações continha pelo menos uma citação inventada — indício claro do impacto dos textos gerados por modelos de IA sem supervisão.

O problema, além de ético, compromete a confiabilidade acadêmica e coloca em risco a reputação de periódicos inteiros. Ao adotar as novas medidas, o ArXiv tenta evitar que o conteúdo automatizado se torne norma no ambiente científico.

Reorganização estrutural e independência financeira

Para lidar com o desafio crescente da moderação automatizada, o ArXiv planeja se tornar uma organização independente e sem fins lucrativos a partir de julho. O objetivo é garantir maior autonomia administrativa e estabilidade orçamentária, já que a operação do repositório depende de financiamento público e institucional — e o custo de monitorar conteúdos gerados por IA cresce rapidamente.

Essa nova configuração também deve atrair parceiros internacionais que já veem o ArXiv como peça-chave na preservação do acesso aberto à ciência e na luta contra o plágio digital e a manipulação algorítmica.

Casos recentes e impacto global

Os reflexos desse debate já chegaram ao Brasil. Um caso semelhante ocorreu no Pará, onde duas advogadas foram multadas em R$ 84 mil por tentar influenciar uma ferramenta de IA usada pela Justiça do Trabalho. Assim como no caso do ArXiv, o objetivo era enganar o algoritmo com instruções ocultas, conhecidas como prompt injection. A fraude foi descoberta, e o caso se tornou um alerta para o uso ético de IA em tribunais.

Perspectivas para o futuro da pesquisa com IA

Essa postura do ArXiv ilustra uma tendência maior na academia: a necessidade de regulamentar o uso de IA em pesquisas científicas. Enquanto universidades e agências de fomento ainda estabelecem suas próprias diretrizes, o repositório se adianta ao criar um sistema de punição e verificação mais transparente.

Em um cenário onde a geração automática de texto se torna cada vez mais sofisticada, preservar a confiabilidade das publicações acadêmicas será essencial. O desafio, agora, é equilibrar inovação e responsabilidade.

Perguntas frequentes

O que motivou o ArXiv a proibir artigos com texto gerado por IA?
A decisão foi tomada devido ao aumento de submissões que continham referências falsas e trechos de chatbot inseridos sem revisão humana, o que comprometia a integridade científica do repositório.
Pesquisadores podem usar IA em suas pesquisas?
Sim, desde que o uso ocorra de forma responsável e com curadoria humana. O ArXiv proíbe apenas o envio de textos não verificados ou completamente automatizados.
Qual é a punição prevista pelas novas regras?
Autores que enviarem artigos com texto gerado por IA serão banidos por até um ano. Após o período, novas submissões só serão aceitas se o artigo tiver passado por revisão por pares.
O que é um preprint e por que o ArXiv é importante?
Preprints são versões preliminares de estudos científicos publicadas antes da revisão por pares. O ArXiv é um dos principais repositórios desse tipo, favorecendo o acesso aberto ao conhecimento.

Considerações finais

Ao adotar uma política inédita de banimento para artigos com lixo gerado por IA, o ArXiv sinaliza um marco na defesa da autenticidade da ciência. A medida não apenas reforça a importância da revisão humana, como também deixa claro que a era das inteligências artificiais exige responsabilidade ética e técnica. O equilíbrio entre automação e credibilidade será o grande desafio da próxima década na comunicação científica.