NoticiasTecnologia

Anthropic destruiu milhões de livros para treinar IA

PUBLICIDADE

Anthropic comprou e desmantelou milhões de livros físicos nos EUA para digitalizá-los e alimentar seu modelo de linguagem Claude, rival do ChatGPT. O fato veio à tona em 26 de junho de 2025, em uma decisão judicial que considerou o ato protegido pelo fair use. A revelação acende novos alertas sobre direitos autorais, transparência e sustentabilidade na corrida pela inteligência artificial generativa.

O que levou à destruição dos livros?

Para criar modelos capazes de responder a praticamente qualquer pergunta, as empresas de IA buscam corpora gigantescos e diversificados. Entre eles, livros são considerados ouro puro: linguagem curada, estruturada e, muitas vezes, revisada por especialistas. Segundo a ação movida por um consórcio de editoras, a Anthropic adquiriu “milhões de volumes por atacado”. Cada exemplar teve a lombada retirada, as páginas foram passadas em scanners industriais e, em seguida, o papel foi jogado fora por não ter mais valor comercial.

A empresa argumentou que comprar livros com “direito de destruí-los” sairia mais barato do que negociar licenças digitais título a título. Além disso, processos automatizados de OCR (reconhecimento óptico de caracteres) teriam permitido indexar o texto rapidamente para fins de treinamento.

PUBLICIDADE

Como a justiça interpretou o fair use?

O juiz responsável avaliou quatro critérios clássicos do fair use, mas destacou dois pontos decisivos:

  • Transformação objetiva: ao converter papel em dados somente legíveis por máquina, a Anthropic teria criado “um novo propósito” – análise estatística em vez de leitura humana.
  • Impossibilidade de substituição de mercado: como os PDFs não seriam distribuídos ao público, o tribunal entendeu que as vendas de livros não seriam diretamente afetadas.

Curiosamente, a própria destruição física pesou a favor da companhia. Para o magistrado, a eliminação dos exemplares reforçou a ideia de um uso “puramente analítico” do conteúdo, afastando o risco de cópias ilegais circularem por aí.

“A remoção das lombadas e o descarte subsequente dos livros indica a intenção de evitar que cópias digitalizadas compitam com as edições originais.”

Trecho da decisão do Tribunal Distrital do Norte da Califórnia

Riscos e críticas de autores e editoras

Grupos de autores argumentam que modelos como Claude podem, ocasionalmente, reproduzir trechos literais de obras protegidas, colocando em xeque a suposta transformação. A Authors Guild afirma que decisões como essa reduzem o poder de barganha dos criadores, já que as big techs podem contornar negociações coletivas simplesmente comprando livros usados e triturando-os.

Editoras também temem um precedente perigoso: se a digitalização destrutiva se tornar norma, o número de exemplares físicos disponíveis para bibliotecas de pesquisa pode despencar, dificultando acesso público a edições raras.

Desdobramentos legais em andamento

ProcessoRéuReivindicaçãoValor Máximo
Consórcio de Editoras vs AnthropicAnthropicUso de livros piratasUS$ 150 mil/obra
Disney vs MidjourneyMidjourneyReplicação de IP visuaisIndefinido
Getty Images vs Stability AIStability AIUso não licenciado de fotosUS$ 1,8 bi

Impacto para a indústria de IA

Analistas enxergam na vitória parcial da Anthropic um alívio temporário para o setor. Nick Clegg, ex-executivo da Meta, chegou a admitir que “a IA morreria da noite para o dia” se precisasse obter consentimento individual de cada titular de direitos. A decisão, portanto, remove um dos maiores gargalos de desenvolvimento, mas à custa de indignação pública.

Anthropic destruiu milhões de livros: Livros empilhados antes da digitalização pela Anthropic
Pilha de exemplares adquiridos em lotes antes de serem desmembrados.

Do ponto de vista técnico, ter acesso a milhões de livros de alta qualidade linguística pode acelerar a capacidade de geração de texto, resumo e tradução. Contudo, o “custo ambiental” levanta outra bandeira: triturar toneladas de papel apenas para extrair dados desafia metas de sustentabilidade de muitas empresas de tecnologia.

Possíveis repercussões futuras

  • Novo julgamento em dezembro: o tribunal ainda avaliará a alegação de que a Anthropic treinou parte do modelo com livros piratas.
  • Pressão regulatória: projetos de lei, como o AI Copyright Protection Act, ganham força no Congresso norte-americano.
  • Acordos de licenciamento coletivo: editoras podem buscar modelos similares aos já firmados entre gravadoras e serviços de streaming.
  • Sinal amarelo para startups: pequenas empresas de IA talvez não consigam arcar com aquisições físicas em larga escala nem com potenciais multas.

Considerações finais

A destruição de milhões de livros pela Anthropic escancara o conflito entre inovação acelerada e proteção à propriedade intelectual. Enquanto tribunais buscam equilibrar interesses, autores, editoras e sociedade cobram transparência e modelos de compensação justos. A audiência de dezembro promete novos capítulos – e o mercado editorial acompanha de perto.

Perguntas frequentes sobre Anthropic destruiu milhões de livros

  1. A Anthropic vai disponibilizar os PDFs ao público?

    Não. Nos autos, a empresa afirmou que os arquivos digitais serão usados apenas internamente para análise algorítmica, sem distribuição externa, o que pesou a favor do fair use.

  2. Livros em domínio público também foram destruídos?

    Sim, mas a maior parte do acervo era protegida por copyright. A presença de obras de domínio público não isenta a empresa de responsabilidade sobre títulos ainda protegidos.

  3. Autoras e autores podem processar a Anthropic individualmente?

    Podem, mas é mais provável que se juntem a ações coletivas para reduzir custos. O tribunal sinalizou abertura para litígios adicionais caso ocorram reproduções literais de obras.

  4. A destruição física era realmente necessária?

    Especialistas em digitalização dizem que remover a lombada agiliza o processo em escala industrial. No entanto, métodos não destrutivos existem, embora sejam mais lentos e caros.

  5. O que acontece se a Anthropic perder parte do julgamento em dezembro?

    Caso seja condenada pelo uso de cópias piratas, a companhia pode pagar até US$ 150 mil por obra, além de possíveis medidas cautelares que limitem futuras digitalizações.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.

Deixe um comentário