Andrej Karpathy lança o ‘autoresearch’ e revoluciona a automação da pesquisa em IA
O ex-líder de IA da Tesla e cofundador da OpenAI, Andrej Karpathy, surpreendeu novamente a comunidade tecnológica ao lançar seu novo projeto open source, chamado autoresearch. Trata-se de um sistema autônomo de experimentação que permite a execução de centenas de testes de inteligência artificial enquanto os pesquisadores dormem — literalmente automatizando o método científico.
Tabela de conteúdos
Em sua postagem no X (Twitter), Karpathy descreveu o autoresearch como um script de apenas 630 linhas hospedado no GitHub sob a licença MIT, mas com uma ambição monumental: “O objetivo é projetar agentes capazes de realizar progresso científico indefinidamente, sem intervenção humana”.
Como funciona o autoresearch
O sistema baseia-se em um loop autônomo de otimização. Um agente de IA recebe um script de treinamento e um orçamento computacional fixo — normalmente cinco minutos de GPU. Ele lê seu próprio código, gera hipóteses de melhoria, modifica parâmetros, executa o experimento e avalia os resultados.
Se o resultado melhora — medido pela perda de validação (validation loss) — a modificação é mantida. Caso contrário, o código é revertido e outra hipótese é testada. Em um único turno noturno, o agente de Karpathy conduziu 126 experimentos autônomos, reduzindo a perda de 0,9979 para 0,9697.
Após dois dias, o sistema havia realizado cerca de 700 alterações automáticas em um modelo de profundidade 12, alcançando uma melhoria de 11% em eficiência, medida pela métrica “Time to GPT‑2”. Karpathy comentou: “Ver o agente executar todo o fluxo de trabalho sozinho é insano”.
Repercussão e aplicações além da ciência da computação
O efeito viral foi imediato. O projeto entrou em discussão em toda a comunidade de machine learning, somando milhões de visualizações em apenas 48 horas. Desenvolvedores e pesquisadores começaram a adaptar o código, criando variações colaborativas do chamado “Karpathy Loop”.
Entre eles, Varun Mathur, CEO da Hyperspace AI, tornou o sistema distribuído entre dezenas de máquinas de diferentes capacidades. Em uma única noite, 35 agentes autônomos realizaram 333 experimentos simultâneos e independentes.
- Diversidade de Hardware: enquanto GPUs poderosas adotaram estratégias de força bruta, computadores comuns exploraram otimizações criativas nos métodos de inicialização.
- Descoberta Cooperativa: usando o protocolo GossipSub, as descobertas se propagaram em tempo real pela rede.
- Redescoberta da História: em 17 horas, os agentes replicaram avanços de oito anos em aprendizado de máquina, como RMSNorm e embeddings amarrados.
Do laboratório ao marketing: 36 mil experimentos por ano
O empreendedor e estrategista de marketing Eric Siu, fundador da agência Single Grain, enxergou um impacto além da ciência de dados. Segundo ele, autoresearch pode multiplicar o número de experimentos de marketing de 30 por ano para mais de 36 mil.
A lógica é a mesma: substituir o script técnico por um ativo de marketing — uma página, um anúncio, um e‑mail — e deixar o agente testar variações automáticas em CTA, design e abordagem, medindo o resultado conforme taxas de resposta positivas.
“As empresas que vencerem não terão melhores marqueteiros”, escreveu Siu. “Terão ciclos de experimentação mais rápidos”.
Debates e riscos da automação total com autoresearch
Nem tudo é entusiasmo. Nas discussões do GitHub, surgiram preocupações sobre a super‑otimização e o possível “vazamento” do conjunto de validação. O pesquisador alexisthual alertou: “Rodar milhares de experimentos pode acabar viciando o modelo nos dados de teste”.
Outro usuário questionou o valor prático das melhorias percentuais: “De 0,9979 para 0,9697 — o ganho é realmente perceptível?”. Karpathy respondeu: “São ganhos reais de performance por capacidade computacional. O objetivo é o progresso contínuo.”
Usuários externos também começaram a replicar os resultados. Um experimento conduzido por witcheer, da Yari Finance, em um Mac Mini M4, mostrou que sete dos 35 testes bem-sucedidos simplificaram a arquitetura do modelo — uma lição clássica em IA: menos pode ser mais.
O futuro da curiosidade automatizada
O autoresearch sugere uma transição simbólica: humanos deixam de ser os experimentadores diretos e passam a ser designers de experimentos. Ferramentas emergentes como DarkMatter e Optimization Arena reforçam esse ecossistema de exploração autônoma, onde o verdadeiro gargalo da inovação torna-se nossa própria curiosidade e capacidade de formular boas hipóteses.
Como Karpathy concluiu, estamos entrando em uma era em que “não programamos modelos, mas criamos ecossistemas que aprendem sozinhos, enquanto dormimos”.
O que é o autoresearch criado por Andrej Karpathy?
É um projeto open source escrito em Python que automatiza o método científico com agentes de IA. Ele executa experimentos, avalia resultados e melhora modelos sem intervenção humana, promovendo progresso contínuo e autônomo em aprendizado de máquina.
Como o autoresearch impacta outras áreas além da IA?
Seu princípio de experimentação autônoma pode ser aplicado a marketing, finanças e biotecnologia, permitindo testar hipóteses em escala massiva e acelerar descobertas que antes exigiam meses de trabalho humano.
Qual é o risco principal do uso intensivo dessa automação?
Pesquisadores alertam para o risco de over‑fitting: agentes podem otimizar tanto os modelos que eles se tornam viciados em dados específicos de validação, perdendo capacidade de generalização.
Considerações finais
O autoresearch de Andrej Karpathy marca uma virada histórica na relação entre pesquisadores e máquinas. O que começou como um simples script é agora o símbolo da próxima revolução científica — uma onde o progresso não dorme, mesmo quando nós dormimos.

