Lançamento do DeepSeek R2 é Adiado por Insatisfação do CEO com o Desempenho do Modelo
DeepSeek R2 não será lançando agora, sucessor de seu celebrado modelo de raciocínio R1, após o CEO Liang Wenfeng avaliar que a performance ainda não atende ao padrão exigido. A decisão, confirmada por fontes ouvidas pelo The Information e detalhada pela Reuters em 26 de junho de 2025, adiciona tensão à corrida chinesa por inteligência artificial em um momento em que a escassez de chips Nvidia H20, gerada por restrições de exportação dos Estados Unidos, ameaça atrasar todo o ecossistema local de IA. Entenda quem é afetado, como o bloqueio de hardware complica o cronograma e o que esperar dos próximos passos da startup sediada em Pequim.
Tabela de conteúdos
O que motivou o adiamento do R2?
Planejado inicialmente para maio, o R2 foi concebido para oferecer melhor capacidade de programação e raciocínio multilíngue, ultrapassando a limitação de foco em inglês do R1. De acordo com duas pessoas com conhecimento direto do assunto, Liang Wenfeng considera que o modelo ainda apresenta alucinações acima do aceitável e desempenho inconsistente em tarefas de lógica avançada. Desde março, engenheiros da DeepSeek trabalham em ciclos curtos de treinamento e avaliação, mas melhorias marginais não convenceram o CEO a liberar a versão pública.
O perfeccionismo de Liang tem histórico: em 2024, ele adiou em um mês o R1 para incluir filtros de segurança adicionais e conquistar uma certificação de conformidade exigida pelo regulador chinês de ciberespaço. A estratégia deu retorno: o R1 acumula mais de 150 mil clientes corporativos e integra aplicativos de bancos, seguradoras e plataformas de comércio eletrônico.
“Lançar antes da hora é arriscar perder credibilidade num mercado que já questiona a maturidade dos LLMs chineses.”
Analista sênior de IA do CITIC Securities
Falta de chips Nvidia pressiona nuvens chinesas
Mesmo que Liang aprovasse hoje o R2, sua adoção maciça esbarraria em restrições de hardware. A nova leva de controles de exportação do governo dos EUA, reforçada em abril de 2025, barrou a venda dos já limitados Nvidia H20 – os únicos aceleradores de IA que a fabricante podia ofertar legalmente à China. Fontes em grandes provedores de nuvem, como Alibaba Cloud e Tencent Cloud, relatam filas de espera para instâncias H20 e preços até 35% maiores em contratos spot.
A DeepSeek distribuiu white papers com as especificações do R2 para orientar arquiteturas que tentem compensar a ausência dos chips mais potentes; porém, sem acesso a GPUs equivalentes, a latência de inferência deve dobrar e o custo operacional subir até 40%, segundo estimativas internas de um parceiro de nuvem que roda o R1.
Impacto para clientes corporativos e desenvolvedores
Entre os atuais usuários do R1, 72% executam modelos em clusters Nvidia H20, de acordo com dados compilados pela consultoria 01.AI. O adiamento frustra planos de empresas de software financeiro que contavam com o R2 para automatizar geração de código em Python e R. Desenvolvedores independentes, por sua vez, temem que um eventual lançamento com desempenho aquém do prometido comprometa a escalabilidade de aplicações SaaS voltadas a mercados externos.
- Startups de saúde digital previam integrar R2 para resumos clínicos multilíngues.
- Plataformas de e-commerce planejam chatbots que reconheçam dialetos locais.
- Fintechs buscavam usar o novo modelo para auditorias de código em tempo real.
Especialistas recomendam que equipes técnicas mantenham seus pipelines desacoplados de fornecedores únicos de LLMs para evitar vendor lock-in e atrasos imprevisíveis.
Panorama da corrida de IA na China
O adiamento do R2 ocorre enquanto concorrentes como Baidu, Alibaba e iFlytek aceleram lançamentos próprios para garantir espaço no mercado de 14 bilhões de dólares previsto para LLMs na China em 2026, segundo a CCID Consulting. Em paralelo, gigantes globais adotam estratégias para driblar o gargalo de hardware: a OpenAI recorreu a GPUs da Google Cloud para alguns de seus produtos, conforme revelado pela Reuters.

Para pesquisadores, o caso DeepSeek exemplifica como avanços de software dependem de cadeias globais de suprimento. “Sem acesso a hardware de ponta, modelos locais ficam condenados a treinar com conjuntos menores ou esperar mais tempo, perdendo paridade com rivais ocidentais”, avalia Li Cheng, professor de ciência da computação na Universidade de Tsinghua.
Quando o R2 será lançado?
Resposta direta: A DeepSeek não forneceu nova data oficial.Expansão: Fontes internas sugerem que o cronograma só será revisto quando Liang Wenfeng aprovar métricas de desempenho superiores às do R1 em lógica e código, algo que pode levar de 4 a 6 semanas adicionais.Validação: Informação baseada em depoimentos de dois engenheiros da equipe e relatórios do The Information.
O R1 continuará recebendo suporte?
Resposta direta: Sim, o R1 segue no roadmap da empresa.Expansão: Clientes corporativos receberão patches de segurança trimestrais e melhorias de eficiência até pelo menos 2026, asseguram documentos de parceria obtidos pela Reuters.Validação: Contratos revisados incluem cláusulas de SLA de 99,9% de uptime.
A falta de chips H20 pode ser resolvida?
Resposta direta: No curto prazo, o cenário é adverso.Expansão: As sanções dos EUA impedem a venda dos H20, e alternativas chinesas como a Biren BR104 ainda não atingem o mesmo desempenho. Provedores estudam pooling de GPUs e uso de FPGAs para inferência.Validação: Dados coletados de relatórios da Alibaba Cloud e White Paper da Academia Chinesa de Ciências.
Considerações finais sobre o DeepSeek R2
O adiamento do DeepSeek R2 destaca a delicada interdependência entre inovação de software e geopolitização do hardware. Enquanto Liang Wenfeng busca excelência técnica, seus clientes aguardam ansiosamente por avanços que possam competir globalmente. Até lá, o R1 continua sendo a espinha dorsal de muitas aplicações empresariais, mas o relógio da vantagem competitiva não para: outros players já se movem para preencher o vazio deixado pelo atraso.