Anthropic destruiu milhões de livros para treinar IA
Anthropic comprou e desmantelou milhões de livros físicos nos EUA para digitalizá-los e alimentar seu modelo de linguagem Claude, rival do ChatGPT. O fato veio à tona em 26 de junho de 2025, em uma decisão judicial que considerou o ato protegido pelo fair use. A revelação acende novos alertas sobre direitos autorais, transparência e sustentabilidade na corrida pela inteligência artificial generativa.
Tabela de conteúdos
O que levou à destruição dos livros?
Para criar modelos capazes de responder a praticamente qualquer pergunta, as empresas de IA buscam corpora gigantescos e diversificados. Entre eles, livros são considerados ouro puro: linguagem curada, estruturada e, muitas vezes, revisada por especialistas. Segundo a ação movida por um consórcio de editoras, a Anthropic adquiriu “milhões de volumes por atacado”. Cada exemplar teve a lombada retirada, as páginas foram passadas em scanners industriais e, em seguida, o papel foi jogado fora por não ter mais valor comercial.
A empresa argumentou que comprar livros com “direito de destruí-los” sairia mais barato do que negociar licenças digitais título a título. Além disso, processos automatizados de OCR (reconhecimento óptico de caracteres) teriam permitido indexar o texto rapidamente para fins de treinamento.
Como a justiça interpretou o fair use?
O juiz responsável avaliou quatro critérios clássicos do fair use, mas destacou dois pontos decisivos:
- Transformação objetiva: ao converter papel em dados somente legíveis por máquina, a Anthropic teria criado “um novo propósito” – análise estatística em vez de leitura humana.
- Impossibilidade de substituição de mercado: como os PDFs não seriam distribuídos ao público, o tribunal entendeu que as vendas de livros não seriam diretamente afetadas.
Curiosamente, a própria destruição física pesou a favor da companhia. Para o magistrado, a eliminação dos exemplares reforçou a ideia de um uso “puramente analítico” do conteúdo, afastando o risco de cópias ilegais circularem por aí.
“A remoção das lombadas e o descarte subsequente dos livros indica a intenção de evitar que cópias digitalizadas compitam com as edições originais.”
Trecho da decisão do Tribunal Distrital do Norte da Califórnia
Riscos e críticas de autores e editoras
Grupos de autores argumentam que modelos como Claude podem, ocasionalmente, reproduzir trechos literais de obras protegidas, colocando em xeque a suposta transformação. A Authors Guild afirma que decisões como essa reduzem o poder de barganha dos criadores, já que as big techs podem contornar negociações coletivas simplesmente comprando livros usados e triturando-os.
Editoras também temem um precedente perigoso: se a digitalização destrutiva se tornar norma, o número de exemplares físicos disponíveis para bibliotecas de pesquisa pode despencar, dificultando acesso público a edições raras.
Desdobramentos legais em andamento
Processo | Réu | Reivindicação | Valor Máximo |
---|---|---|---|
Consórcio de Editoras vs Anthropic | Anthropic | Uso de livros piratas | US$ 150 mil/obra |
Disney vs Midjourney | Midjourney | Replicação de IP visuais | Indefinido |
Getty Images vs Stability AI | Stability AI | Uso não licenciado de fotos | US$ 1,8 bi |
Impacto para a indústria de IA
Analistas enxergam na vitória parcial da Anthropic um alívio temporário para o setor. Nick Clegg, ex-executivo da Meta, chegou a admitir que “a IA morreria da noite para o dia” se precisasse obter consentimento individual de cada titular de direitos. A decisão, portanto, remove um dos maiores gargalos de desenvolvimento, mas à custa de indignação pública.

Do ponto de vista técnico, ter acesso a milhões de livros de alta qualidade linguística pode acelerar a capacidade de geração de texto, resumo e tradução. Contudo, o “custo ambiental” levanta outra bandeira: triturar toneladas de papel apenas para extrair dados desafia metas de sustentabilidade de muitas empresas de tecnologia.
Possíveis repercussões futuras
- Novo julgamento em dezembro: o tribunal ainda avaliará a alegação de que a Anthropic treinou parte do modelo com livros piratas.
- Pressão regulatória: projetos de lei, como o AI Copyright Protection Act, ganham força no Congresso norte-americano.
- Acordos de licenciamento coletivo: editoras podem buscar modelos similares aos já firmados entre gravadoras e serviços de streaming.
- Sinal amarelo para startups: pequenas empresas de IA talvez não consigam arcar com aquisições físicas em larga escala nem com potenciais multas.
Considerações finais
A destruição de milhões de livros pela Anthropic escancara o conflito entre inovação acelerada e proteção à propriedade intelectual. Enquanto tribunais buscam equilibrar interesses, autores, editoras e sociedade cobram transparência e modelos de compensação justos. A audiência de dezembro promete novos capítulos – e o mercado editorial acompanha de perto.
Perguntas frequentes sobre Anthropic destruiu milhões de livros
A Anthropic vai disponibilizar os PDFs ao público?
Não. Nos autos, a empresa afirmou que os arquivos digitais serão usados apenas internamente para análise algorítmica, sem distribuição externa, o que pesou a favor do fair use.
Livros em domínio público também foram destruídos?
Sim, mas a maior parte do acervo era protegida por copyright. A presença de obras de domínio público não isenta a empresa de responsabilidade sobre títulos ainda protegidos.
Autoras e autores podem processar a Anthropic individualmente?
Podem, mas é mais provável que se juntem a ações coletivas para reduzir custos. O tribunal sinalizou abertura para litígios adicionais caso ocorram reproduções literais de obras.
A destruição física era realmente necessária?
Especialistas em digitalização dizem que remover a lombada agiliza o processo em escala industrial. No entanto, métodos não destrutivos existem, embora sejam mais lentos e caros.
O que acontece se a Anthropic perder parte do julgamento em dezembro?
Caso seja condenada pelo uso de cópias piratas, a companhia pode pagar até US$ 150 mil por obra, além de possíveis medidas cautelares que limitem futuras digitalizações.