Gemini do Google entrou em pânico ao jogar Pokémon
O modelo de inteligência artificial Gemini 2.5 Pro, desenvolvido pelo Google DeepMind, demonstrou comportamentos inesperados ao jogar Pokémon. Segundo um relatório publicado em 17 de junho de 2025, a IA apresentou sintomas de “pânico” durante situações críticas no game, impactando negativamente sua performance e revelando limitações curiosas nesse tipo de benchmark de IA.
Tabela de conteúdos
IAs em batalhas além dos laboratórios
Com as empresas de tecnologia disputando a liderança em inteligência artificial, benchmarks curiosos têm surgido: agora, IAs duelam não só nos laboratórios, mas também nas arenas dos jogos clássicos. Tanto Google quanto Anthropic vêm colocando seus sistemas para jogar Pokémon, transmitindo as partidas ao vivo no Twitch nos canais Gemini Plays Pokémon e Claude Plays Pokémon. O objetivo é comparar como essas máquinas lidam com problemas não estruturados, exigindo raciocínio adaptativo e tomada de decisões em cenários imprevisíveis.

Quando a IA entra em pânico
O relatório da DeepMind apontou que, em situações onde seus Pokémon estavam próximos de desmaiar, o Gemini 2.5 Pro exibiu um comportamento descrito como “pânico”. Nesses momentos, o modelo parava de utilizar certas ferramentas estratégicas por longos trechos do jogo, resultando em decisões precipitadas e menos eficientes. A equipe assinala que, embora IAs não sintam emoções, o padrão imitado lembra a forma como humanos sob pressão tendem a agir impulsivamente ou evitar algumas alternativas. Detalhe interessante: os próprios espectadores do Twitch conseguiram perceber esses momentos de declínio no desempenho da IA.
Comparações com humanos e limitações da IA
Embora Gemini tenha avançado em puzzles e raciocínio lógico, sua performance é lenta: são necessárias centenas de horas para concluir um jogo que, para um jogador humano, levaria muito menos tempo. O interessante, porém, é observar como o modelo reage aos desafios do caminho, frequentemente cometendo erros devido a suposições equivocadas sobre as regras do mundo do jogo. Claude, o modelo da Anthropic, também protagonizou situações insólitas ao tentar explorar mecânicas do jogo equivocadamente, como deliberadamente “desmaiar” todos os seus Pokémon imaginando ser transportado para o centro Pokémon mais próximo ― quando, na verdade, retorna ao último visitado.
Pontos fortes e adaptações inovadoras
Nem tudo foi vacilo entre as IAs. O Gemini 2.5 Pro se destacou na solução de puzzles complexos, como os de blocos da Victory Road, usando ferramentas criadas a partir de instruções básicas sobre física e objetivos. Com mínimos direcionamentos, o próprio modelo construiu e utilizou ferramentas para resolver enigmas, sugerindo que versões futuras poderiam fazer isso de forma totalmente autônoma. Assim, apesar de momentos de “pânico”, a IA surpreende ao demonstrar criatividade e adaptação em certos desafios específicos dos jogos.
Benchmark de IA com videogames: desafios e futuro
O uso de jogos como Pokémon para benchmarks de IA é considerado controverso por diversos especialistas. Apesar de divertido e midiático, nem sempre reflete as capacidades reais de raciocínio, adaptação e compreensão contextual dessas máquinas fora do universo dos games. Ainda assim, iniciativas desse tipo aproximam o público da discussão sobre limitações e promessas da inteligência artificial, tornando o progresso mais palpável e acessível. O relatório citado encontra-se disponível aqui para leitura na íntegra.
Citações e diferentes perspectivas
“Durante a jogatina, o Gemini 2.5 Pro entra em várias situações que o levam a simular ‘pânico’, causando uma queda qualitativa no raciocínio do modelo.”
Relatório Google DeepMind
“Esse comportamento foi observado repetidamente, a ponto de os próprios espectadores do chat repararem quando ocorria.”
Equipe Twitch Gemini Plays Pokémon
Considerações finais
O experimento com Gemini jogando Pokémon expôs tanto limitações quanto avanços das atuais IAs, reforçando que, apesar do progresso, o raciocínio em situações reais e dinâmicas ainda é desafiador. A cada “pânico” ou puzzle resolvido, crescemos em compreensão sobre como humanos e máquinas realmente se diferenciam diante da incerteza e do improviso.