NoticiasInteligência ArtificialTecnologia

Busca com IA prioriza sites menos populares, diz estudo

PUBLICIDADE

Busca com IA generativa têm recorrido a fontes menos populares que a busca tradicional do Google, segundo um estudo conduzido pela Universidade Ruhr de Bochum, na Alemanha, em parceria com o Max Planck Institute for Software Systems.

Ao analisar respostas de sistemas como AI Overviews, Gemini 2.5 Flash e GPT-4o, os pesquisadores observaram que esses modelos citam com frequência domínios fora dos resultados orgânicos mais visíveis e até além do top 1.000 do ranking Tranco, que mede tráfego e popularidade. A seguir, explicamos a metodologia do trabalho, os principais achados e o que isso significa para usuários, criadores e profissionais de SEO.

busca com IA: O que o estudo investigou ?

O trabalho avaliou como buscadores com IA generativa selecionam e citam suas fontes quando produzem respostas em linguagem natural. Em vez de listar links em ordem de relevância, como faz a busca tradicional, as IAs tendem a sintetizar informações de múltiplos domínios em um único resumo. Os autores buscavam entender se essa síntese altera o conjunto de sites mencionados e como isso se compara ao ranking orgânico do Google.

PUBLICIDADE

Metodologia: consultas, sistemas e métricas

Para realizar a análise, os pesquisadores extraíram milhares de consultas de bases públicas que refletem intenções de busca diversas. A amostra incluiu perguntas oriundas de interações do ChatGPT, tópicos sociais e políticos do watchdog AllSides, os 100 itens mais pesquisados na Amazon e assuntos em alta no Google Trends. Cada consulta foi enviada simultaneamente a:

  • Busca tradicional do Google (página de resultados orgânicos)
  • Google AI Overviews (resumo gerado pela IA)
  • Gemini 2.5 Flash (respostas assistidas por IA)
  • GPT-4o da OpenAI em dois modos: ferramenta de busca GPT-4o e o modo com web integrada

Em seguida, a equipe comparou os domínios citados pelas IAs com os domínios que aparecem entre os 10 e 100 primeiros links do resultado orgânico do Google. Para mensurar popularidade, adotou-se o ranking Tranco, um agregador independente que combina dados de tráfego e reduz ruído de listas manipuladas. A qualidade informacional das respostas também foi avaliada com a LLOOM, ferramenta acadêmica de avaliação da Universidade Stanford.

Principais resultados

  • Fontes fora do top 10: nas AI Overviews, mais da metade dos domínios citados não apareceu entre os 10 primeiros links orgânicos do Google para a mesma consulta.
  • Ausência até no top 100: cerca de 40% das fontes mencionadas nas respostas com IA não estavam presentes nem entre os 100 principais resultados da busca tradicional.
  • Popularidade menor: o Gemini 2.5 Flash frequentemente citou domínios posicionados fora do top 1.000 do Tranco, padrão também observado no GPT-4o e em seu modo de navegação web.
  • Conhecimento pré-treinado: em tópicos estabelecidos, o GPT-4o às vezes entregou resumos sem citar fontes externas, baseando-se no próprio modelo — uma estratégia que se mostrou menos confiável para notícias recentes.

A leitura geral é que a “síntese” operada pelas IAs desloca a visibilidade para sites de menor tráfego e fora dos tradicionais primeiros resultados orgânicos. Isso não implica, por si só, perda de qualidade, mas muda a ecologia de citações e desafia métricas clássicas de autoridade.

Qualidade: amplitude similar, contexto condensado

Segundo a avaliação com a ferramenta LLOOM (Stanford), a amplitude informacional das respostas com IA foi, em média, semelhante àquela encontrada na página de resultados do Google. Porém, os pesquisadores notaram que a busca tradicional tende a oferecer cobertura contextual mais ampla, expondo alternativas e divergências entre fontes. Já os resumos com IA costumam condensar o contexto em uma interpretação única, o que pode omitir pontos de vista minoritários ou caminhos de leitura adicionais.

Representação de inteligência artificial em malha de dados; debate sobre amplitude e condensação de contexto nas respostas de IA
Amplitude semelhante, mas com maior condensação de contexto nas respostas de IA

Por que isso importa para usuários e criadores

  • Para o usuário: respostas mais diretas economizam tempo, mas podem esconder a diversidade de abordagens. Em temas controversos, vale abrir alguns links para confrontar perspectivas.
  • Para publishers: sites menores podem ganhar citação e tráfego indireto quando são usados como base de síntese. Por outro lado, a queda de cliques nos SERPs tradicionais e a leitura “no próprio resultado” desafiam modelos de monetização.
  • Para SEO: atributos de autoridade clássicos (backlinks, popularidade) convivem com sinais de helpful content e expertise. Conteúdo original, bem referenciado e com dados verificáveis tende a ser mais “sintetizável”.

Como as IAs escolhem as fontes

Modelos generativos combinam o que está no pré-treinamento com sinais de relevância recuperados na hora (RAG). A mistura pode favorecer páginas específicas e posts de nicho, nem sempre presentes no top 100 orgânico, mas úteis para responder de forma objetiva à consulta.

Limitações e cautelas

  • Temporalidade: sem busca ativa, o conhecimento pré-treinado pode desatualizar respostas sobre notícias e eventos em andamento.
  • Transparência: algumas respostas de IA não listam todas as fontes usadas, dificultando a verificação independente.
  • Viés de síntese: ao condensar, a IA pode priorizar frames dominantes e atenuar nuances relevantes.

As IAs de busca não apenas ranqueiam: elas compõem respostas. Isso muda o conjunto de sites visíveis e como o usuário percebe autoridade.

Resumo dos autores, a partir da análise acadêmica

O que observar daqui para frente

Se a adoção de resumos com IA continuar avançando, devemos ver maior diversidade de domínios sendo citados, inclusive de baixo tráfego. Para editores, aumentar a claridade factual, o lastro em dados e a originalidade elevará as chances de um conteúdo abastecer respostas sintéticas. Para usuários, o ideal é equilibrar a praticidade da IA com a checagem de algumas fontes primárias, sobretudo em temas sensíveis.


Fontes e referências

Perguntas Frequentes sobre busca com IA e AI Overviews

  1. As respostas com IA são menos confiáveis que a busca tradicional?

    Direto: não necessariamente. Expansão: a avaliação LLOOM indicou amplitude informacional semelhante entre IA e busca orgânica. Porém, as IAs tendem a condensar contexto e, às vezes, não listam todas as fontes, o que pode ocultar visões alternativas. Validação: o estudo foi conduzido por equipes da Ruhr de Bochum e do Max Planck, com validação acadêmica independente.

  2. Por que as IAs citam sites fora do top 1.000 do Tranco?

    Direto: por causa da síntese. Expansão: ao compor respostas, modelos podem recuperar páginas de nicho que respondem melhor a trechos específicos da pergunta, mesmo sem alta popularidade. Validação: a análise comparou domínios citados nas IAs com top 10 e top 100 do Google, usando o ranking Tranco como métrica de popularidade.

  3. O GPT-4o pode responder sem citar fontes externas?

    Direto: sim, em tópicos estabelecidos. Expansão: o modelo às vezes se apoia no conhecimento pré-treinado e entrega resumos sem links; isso é menos confiável para notícias recentes. Validação: o comportamento foi observado empiricamente na amostra de consultas do estudo.

  4. O que muda para SEO com a busca de IA?

    Direto: foco em conteúdo sintetizável. Expansão: textos originais, dados verificáveis, boa estrutura e linguagem clara aumentam a chance de ser citado por IAs, mesmo sem grande popularidade. Validação: os achados mostram citações fora do top 100 e top 1.000, alterando a dinâmica de autoridade.

Considerações finais

O estudo sugere que a busca com IA está menos vinculada aos sinais clássicos de popularidade e mais orientada à utilidade pontual de cada fonte para compor respostas. A qualidade não parece sofrer no agregado, mas a forma de apresentar o conhecimento muda — do ranking para a síntese. Para navegar nesse novo cenário, usuários devem alternar entre o resumo em IA e a leitura de algumas páginas-chave; editores, por sua vez, ganham oportunidade de aparecer em respostas mesmo sem ocupar o topo do SERP, desde que ofereçam conteúdo claro, confiável e com valor informativo distinto.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

0 Comentários
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários
0
Adoraria saber sua opinião, comente.x