Busca com IA prioriza sites menos populares, diz estudo
Busca com IA generativa têm recorrido a fontes menos populares que a busca tradicional do Google, segundo um estudo conduzido pela Universidade Ruhr de Bochum, na Alemanha, em parceria com o Max Planck Institute for Software Systems.
Ao analisar respostas de sistemas como AI Overviews, Gemini 2.5 Flash e GPT-4o, os pesquisadores observaram que esses modelos citam com frequência domínios fora dos resultados orgânicos mais visíveis e até além do top 1.000 do ranking Tranco, que mede tráfego e popularidade. A seguir, explicamos a metodologia do trabalho, os principais achados e o que isso significa para usuários, criadores e profissionais de SEO.
Tabela de conteúdos
busca com IA: O que o estudo investigou ?
O trabalho avaliou como buscadores com IA generativa selecionam e citam suas fontes quando produzem respostas em linguagem natural. Em vez de listar links em ordem de relevância, como faz a busca tradicional, as IAs tendem a sintetizar informações de múltiplos domínios em um único resumo. Os autores buscavam entender se essa síntese altera o conjunto de sites mencionados e como isso se compara ao ranking orgânico do Google.
Metodologia: consultas, sistemas e métricas
Para realizar a análise, os pesquisadores extraíram milhares de consultas de bases públicas que refletem intenções de busca diversas. A amostra incluiu perguntas oriundas de interações do ChatGPT, tópicos sociais e políticos do watchdog AllSides, os 100 itens mais pesquisados na Amazon e assuntos em alta no Google Trends. Cada consulta foi enviada simultaneamente a:
- Busca tradicional do Google (página de resultados orgânicos)
- Google AI Overviews (resumo gerado pela IA)
- Gemini 2.5 Flash (respostas assistidas por IA)
- GPT-4o da OpenAI em dois modos: ferramenta de busca GPT-4o e o modo com web integrada
Em seguida, a equipe comparou os domínios citados pelas IAs com os domínios que aparecem entre os 10 e 100 primeiros links do resultado orgânico do Google. Para mensurar popularidade, adotou-se o ranking Tranco, um agregador independente que combina dados de tráfego e reduz ruído de listas manipuladas. A qualidade informacional das respostas também foi avaliada com a LLOOM, ferramenta acadêmica de avaliação da Universidade Stanford.
Principais resultados
- Fontes fora do top 10: nas AI Overviews, mais da metade dos domínios citados não apareceu entre os 10 primeiros links orgânicos do Google para a mesma consulta.
- Ausência até no top 100: cerca de 40% das fontes mencionadas nas respostas com IA não estavam presentes nem entre os 100 principais resultados da busca tradicional.
- Popularidade menor: o Gemini 2.5 Flash frequentemente citou domínios posicionados fora do top 1.000 do Tranco, padrão também observado no GPT-4o e em seu modo de navegação web.
- Conhecimento pré-treinado: em tópicos estabelecidos, o GPT-4o às vezes entregou resumos sem citar fontes externas, baseando-se no próprio modelo — uma estratégia que se mostrou menos confiável para notícias recentes.
A leitura geral é que a “síntese” operada pelas IAs desloca a visibilidade para sites de menor tráfego e fora dos tradicionais primeiros resultados orgânicos. Isso não implica, por si só, perda de qualidade, mas muda a ecologia de citações e desafia métricas clássicas de autoridade.
Qualidade: amplitude similar, contexto condensado
Segundo a avaliação com a ferramenta LLOOM (Stanford), a amplitude informacional das respostas com IA foi, em média, semelhante àquela encontrada na página de resultados do Google. Porém, os pesquisadores notaram que a busca tradicional tende a oferecer cobertura contextual mais ampla, expondo alternativas e divergências entre fontes. Já os resumos com IA costumam condensar o contexto em uma interpretação única, o que pode omitir pontos de vista minoritários ou caminhos de leitura adicionais.

Por que isso importa para usuários e criadores
- Para o usuário: respostas mais diretas economizam tempo, mas podem esconder a diversidade de abordagens. Em temas controversos, vale abrir alguns links para confrontar perspectivas.
- Para publishers: sites menores podem ganhar citação e tráfego indireto quando são usados como base de síntese. Por outro lado, a queda de cliques nos SERPs tradicionais e a leitura “no próprio resultado” desafiam modelos de monetização.
- Para SEO: atributos de autoridade clássicos (backlinks, popularidade) convivem com sinais de helpful content e expertise. Conteúdo original, bem referenciado e com dados verificáveis tende a ser mais “sintetizável”.
Como as IAs escolhem as fontes
Modelos generativos combinam o que está no pré-treinamento com sinais de relevância recuperados na hora (RAG). A mistura pode favorecer páginas específicas e posts de nicho, nem sempre presentes no top 100 orgânico, mas úteis para responder de forma objetiva à consulta.
Limitações e cautelas
- Temporalidade: sem busca ativa, o conhecimento pré-treinado pode desatualizar respostas sobre notícias e eventos em andamento.
- Transparência: algumas respostas de IA não listam todas as fontes usadas, dificultando a verificação independente.
- Viés de síntese: ao condensar, a IA pode priorizar frames dominantes e atenuar nuances relevantes.
As IAs de busca não apenas ranqueiam: elas compõem respostas. Isso muda o conjunto de sites visíveis e como o usuário percebe autoridade.
Resumo dos autores, a partir da análise acadêmica
O que observar daqui para frente
Se a adoção de resumos com IA continuar avançando, devemos ver maior diversidade de domínios sendo citados, inclusive de baixo tráfego. Para editores, aumentar a claridade factual, o lastro em dados e a originalidade elevará as chances de um conteúdo abastecer respostas sintéticas. Para usuários, o ideal é equilibrar a praticidade da IA com a checagem de algumas fontes primárias, sobretudo em temas sensíveis.
Fontes e referências
- Preprint no arXiv — Universidade Ruhr de Bochum e Max Planck Institute for Software Systems
- Cobertura no TechSpot — resumo dos achados e implicações
Perguntas Frequentes sobre busca com IA e AI Overviews
As respostas com IA são menos confiáveis que a busca tradicional?
Direto: não necessariamente. Expansão: a avaliação LLOOM indicou amplitude informacional semelhante entre IA e busca orgânica. Porém, as IAs tendem a condensar contexto e, às vezes, não listam todas as fontes, o que pode ocultar visões alternativas. Validação: o estudo foi conduzido por equipes da Ruhr de Bochum e do Max Planck, com validação acadêmica independente.
Por que as IAs citam sites fora do top 1.000 do Tranco?
Direto: por causa da síntese. Expansão: ao compor respostas, modelos podem recuperar páginas de nicho que respondem melhor a trechos específicos da pergunta, mesmo sem alta popularidade. Validação: a análise comparou domínios citados nas IAs com top 10 e top 100 do Google, usando o ranking Tranco como métrica de popularidade.
O GPT-4o pode responder sem citar fontes externas?
Direto: sim, em tópicos estabelecidos. Expansão: o modelo às vezes se apoia no conhecimento pré-treinado e entrega resumos sem links; isso é menos confiável para notícias recentes. Validação: o comportamento foi observado empiricamente na amostra de consultas do estudo.
O que muda para SEO com a busca de IA?
Direto: foco em conteúdo sintetizável. Expansão: textos originais, dados verificáveis, boa estrutura e linguagem clara aumentam a chance de ser citado por IAs, mesmo sem grande popularidade. Validação: os achados mostram citações fora do top 100 e top 1.000, alterando a dinâmica de autoridade.
Considerações finais
O estudo sugere que a busca com IA está menos vinculada aos sinais clássicos de popularidade e mais orientada à utilidade pontual de cada fonte para compor respostas. A qualidade não parece sofrer no agregado, mas a forma de apresentar o conhecimento muda — do ranking para a síntese. Para navegar nesse novo cenário, usuários devem alternar entre o resumo em IA e a leitura de algumas páginas-chave; editores, por sua vez, ganham oportunidade de aparecer em respostas mesmo sem ocupar o topo do SERP, desde que ofereçam conteúdo claro, confiável e com valor informativo distinto.

