Perplexity lança DRACO Benchmark e aprimora Deep Research
A Perplexity anunciou o lançamento do DRACO Benchmark, um novo padrão aberto voltado à avaliação de desempenho de agentes de inteligência artificial (IA) em pesquisas complexas. A novidade acompanha a versão mais avançada do recurso Deep Research, agora disponível para os usuários do plano Max. A empresa afirma que o DRACO busca elevar o rigor metodológico na medição de precisão, completude e objetividade de respostas geradas por modelos de IA.
O que é o DRACO Benchmark e por que ele é importante
O DRACO (Deep Research Accuracy, Completeness, and Objectivity) foi desenvolvido para avaliar a qualidade da pesquisa conduzida por sistemas de IA. Esse padrão é público, permitindo que pesquisadores, desenvolvedores e instituições de todo o mundo testem e comparem suas próprias soluções de IA.
Os dados utilizados nas avaliações vêm de consultas reais feitas à Perplexity, abrangendo dez áreas diferentes, incluindo Direito, Medicina, Finanças e pesquisas acadêmicas. A proposta é oferecer um cenário mais realista e menos artificial, distante de benchmarks sintéticos comumente usados no setor.

Critérios de análise do DRACO Benchmark
- Precisão factual
- Amplitude e profundidade analítica
- Qualidade de apresentação das respostas
- Referenciamento e citação de fontes
Um dos diferenciais do benchmark é o uso do protocolo LLM-as-judge, em que um modelo de linguagem atua como avaliador das respostas. Esse sistema busca validar as informações a partir de fontes verificáveis e reduzir ao máximo a subjetividade humana durante o processo de julgamento.
Segundo a Perplexity, os primeiros resultados do DRACO revelam que o Deep Research da empresa teve desempenho superior a outras ferramentas, mostrando-se mais rápido e preciso, especialmente em contextos que exigem detalhamento jurídico ou personalização de informações.
Abertura de dados e impacto no ecossistema de IA
Ao tornar o DRACO um padrão aberto, a Perplexity estimula uma maior transparência e colaboração entre as organizações que desenvolvem agentes de pesquisa baseados em IA. O objetivo é nivelar a avaliação de desempenho de forma justa e contribuir para o avanço da pesquisa científica e técnica na área de inteligência artificial generativa.
Além disso, a empresa reforça seu compromisso em criar tecnologias voltadas à eficiência e confiabilidade, buscando reduzir vieses e aumentar a confiança dos usuários em ferramentas de IA usadas em contextos críticos, como diagnóstico médico ou decisões financeiras.
Convergência com a estratégia de expansão
O lançamento do DRACO coincide com outras iniciativas recentes da Perplexity, como o projeto Model Council, que busca combinar múltiplos modelos de IA em um sistema coordenado. Essa abordagem sinaliza que a empresa pretende acelerar sua transição de motor de busca para plataforma de pesquisa cognitiva integrada.
Com o avanço das avaliações abertas e ferramentas aprimoradas, o Perplexity Max se consolida como uma das soluções mais avançadas para pesquisa assistida por IA — competindo diretamente com plataformas como ChatGPT, Gemini e Claude, que também investem em modelos mais especializados para uso acadêmico e profissional.
Perspectivas futuras
Para a comunidade científica e tecnológica, o DRACO representa mais do que uma métrica: é um passo em direção à padronização de desempenho em pesquisa profunda com IA. À medida que novos agentes cognitivos surgem, comparar resultados de forma justa e baseada em dados reais será essencial para medir avanços substanciais no setor.
A expectativa é que, com o tempo, esse padrão também ajude a identificar limitações de modelos e orientar melhorias contínuas, configurando-se como um divisor de águas na busca por inteligência artificial confiável e responsável.
Perguntas Frequentes sobre o DRACO Benchmark da Perplexity
O que significa DRACO e qual seu objetivo?
DRACO é a sigla para Deep Research Accuracy, Completeness, and Objectivity. Trata-se de um padrão aberto criado para avaliar a capacidade de agentes de IA executarem pesquisas precisas, completas e bem referenciadas em diversos domínios do conhecimento.
Quem pode usar o DRACO Benchmark?
O benchmark é público e pode ser usado por pesquisadores, desenvolvedores e organizações que desejem testar seus próprios sistemas de IA em cenários de pesquisa complexa.
Como o DRACO difere de outros benchmarks de IA?
Diferente de padrões sintéticos, o DRACO se baseia em milhões de consultas reais feitas por usuários, refletindo desafios autênticos de pesquisa e reduzindo a distância entre avaliação e uso prático.
O recurso Deep Research está disponível para todos os usuários?
Inicialmente, o Deep Research aprimorado está disponível para assinantes do plano Perplexity Max, com expansão prevista para o plano Pro nos próximos dias.
Qual o impacto do DRACO na indústria de IA?
Ao estabelecer um modelo público de análise comparativa, o DRACO promove transparência e incentiva melhores práticas entre empresas que desenvolvem modelos de pesquisa baseados em IA.
Considerações finais
Com o DRACO Benchmark, a Perplexity reafirma seu protagonismo no desenvolvimento de ferramentas de Deep Research voltadas à precisão e confiabilidade. A abertura do padrão ao público e a integração de métodos avançados de avaliação indicam um avanço significativo rumo a uma inteligência artificial mais transparente, responsável e útil para a sociedade científica e tecnológica.

