Press ESC to close

Alibaba ZeroSearch: IA busca autônoma e corte de 88% custos

PUBLICIDADE

Pesquisadores do Alibaba Group revelaram o ZeroSearch, uma abordagem inovadora que permite a sistemas de Inteligência Artificial (IA), especificamente Modelos de Linguagem Grandes (LLMs), desenvolver capacidades avançadas de busca por informações de forma simulada, eliminando a necessidade de APIs caras de motores de busca comerciais. Esta tecnologia promete uma redução drástica de até 88% nos custos de treinamento, além de oferecer maior controle sobre o processo de aprendizado da IA na recuperação de informações.

O Desafio: Custos e Limitações no Treinamento de IA para Busca

Desenvolver assistentes de IA capazes de buscar informações autonomamente enfrenta dois obstáculos principais: a qualidade imprevisível dos documentos retornados por motores de busca durante o treinamento e os custos proibitivos de realizar centenas de milhares de chamadas de API a serviços como o Google. Conforme destacado no artigo científico publicado no arXiv, “o treinamento por aprendizado de reforço [RL] requer frequentes implementações, potencialmente envolvendo centenas de milhares de solicitações de busca, o que acarreta despesas substanciais de API e restringe severamente a escalabilidade.”

ZeroSearch: Como a IA Aprende a Pesquisar Sem Motores de Busca

A solução do Alibaba, detalhada na página do projeto ZeroSearch, inicia com um processo leve de ajuste fino supervisionado. Esse ajuste transforma um LLM em um módulo de recuperação capaz de gerar documentos relevantes e irrelevantes em resposta a uma consulta. Durante o treinamento por aprendizado de reforço, o sistema utiliza uma “estratégia de implementação baseada em currículo” que degrada gradualmente a qualidade dos documentos gerados, ensinando a IA a discernir e buscar melhor.

PUBLICIDADE

“Nossa principal percepção é que os LLMs adquiriram vasto conhecimento de mundo durante o pré-treinamento em larga escala e são capazes de gerar documentos relevantes dada uma consulta de busca. A principal diferença entre um motor de busca real e um LLM de simulação reside no estilo textual do conteúdo retornado.”

Pesquisadores do Alibaba, no artigo sobre o ZeroSearch

Resultados: Desempenho Superior com Economia de 88%

Em experimentos abrangentes utilizando sete conjuntos de dados de perguntas e respostas, o ZeroSearch não apenas igualou, mas frequentemente superou o desempenho de modelos treinados com motores de busca reais. Notavelmente, um módulo de recuperação de 7 bilhões de parâmetros atingiu desempenho comparável ao Google Search, enquanto um módulo de 14 bilhões de parâmetros chegou a superá-lo.

A economia de custos é substancial. Treinar com aproximadamente 64.000 consultas de busca usando o Google Search via SerpAPI custaria cerca de US$ 586,70. Com o ZeroSearch, utilizando um LLM de simulação de 14B parâmetros em quatro GPUs A100, o custo foi de apenas US$ 70,80 – uma redução de 88%. “Isso demonstra a viabilidade de usar um LLM bem treinado como substituto para motores de busca reais em configurações de aprendizado por reforço,” aponta o estudo.

Implicações Futuras: Democratização e Autonomia da IA

O ZeroSearch representa uma mudança significativa na forma como os sistemas de IA podem ser treinados. Ao permitir que a IA simule a busca, reduz-se a dependência de ferramentas externas e dispendiosas controladas por grandes empresas de tecnologia. Para startups e empresas menores com orçamentos limitados, essa abordagem pode nivelar o campo de atuação, tornando o treinamento avançado de IA mais acessível.

Além da economia, a técnica oferece aos desenvolvedores maior controle sobre o processo de treinamento, permitindo um ajuste fino da informação que a IA processa. O método é compatível com diversas famílias de modelos, como Qwen-2.5 e LLaMA-3.2. Os pesquisadores disponibilizaram código, conjuntos de dados e modelos pré-treinados no GitHub e Hugging Face, fomentando a adoção da abordagem pela comunidade.

A ironia é notável: ao ensinar a IA a pesquisar sem motores de busca, o Alibaba pode ter criado uma tecnologia que torna os motores de busca tradicionais menos necessários para o desenvolvimento da própria IA, sinalizando um futuro onde sistemas de IA se tornam cada vez mais autossuficientes.

  • Redução de Custo: Corte de até 88% nos custos de treinamento de IA para busca.
  • Autonomia da IA: LLMs aprendem a buscar informações através de simulação, sem APIs externas.
  • Desempenho: Comparável ou superior a modelos treinados com motores de busca reais como o Google.
  • Acessibilidade: Democratiza o desenvolvimento de IA avançada para empresas com menos recursos.
  • Controle: Maior domínio sobre os dados e o processo de treinamento.
  1. O que é o ZeroSearch do Alibaba?

    ZeroSearch é uma tecnologia do Alibaba que treina Modelos de Linguagem Grandes (LLMs) para buscar informações simulando o processo, sem usar motores de busca reais. Isso reduz custos e aumenta o controle do treinamento.

  2. Como o ZeroSearch reduz os custos de treinamento de IA?

    Ele elimina a necessidade de pagar por APIs de motores de busca comerciais, como Google Search. A simulação interna é significativamente mais barata, resultando em até 88% de economia, conforme demonstrado nos estudos do Alibaba.

  3. O ZeroSearch é mais eficiente que treinar IA com o Google?

    Testes do Alibaba indicam que o ZeroSearch pode igualar ou até superar o desempenho de modelos treinados com o Google Search em tarefas de resposta a perguntas, mas com um custo drasticamente menor e maior controle sobre os dados de treinamento.

  4. Onde posso encontrar os recursos do ZeroSearch?

    O Alibaba disponibilizou o código, datasets e modelos pré-treinados do ZeroSearch no GitHub (Alibaba-nlp/ZeroSearch) e na plataforma Hugging Face (coleção sunhaonlp/zerosearch), permitindo que outros pesquisadores e empresas utilizem a tecnologia.

Considerações finais

O ZeroSearch do Alibaba é um avanço promissor que pode redefinir as práticas de treinamento para modelos de IA que necessitam de capacidades de busca. Ao tornar o processo mais acessível e eficiente, a tecnologia tem o potencial de acelerar a inovação e diversificar o cenário de desenvolvimento de Inteligência Artificial, reduzindo a dependência de plataformas de busca estabelecidas para essa finalidade específica.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.

Deixe um comentário