Quando o R2 será lançado?

Resposta direta: A DeepSeek não forneceu nova data oficial. Expansão: Fontes internas sugerem que o cronograma só será revisto quando Liang Wenfeng aprovar métricas de desempenho superiores às do R1 em lógica e código, algo que pode levar de 4 a 6 semanas adicionais. Validação: Informação baseada em depoimentos de dois engenheiros da equipe e relatórios do The Information.

O R1 continuará recebendo suporte?

Resposta direta: Sim, o R1 segue no roadmap da empresa. Expansão: Clientes corporativos receberão patches de segurança trimestrais e melhorias de eficiência até pelo menos 2026, asseguram documentos de parceria obtidos pela Reuters. Validação: Contratos revisados incluem cláusulas de SLA de 99,9% de uptime.

A falta de chips H20 pode ser resolvida?

Resposta direta: No curto prazo, o cenário é adverso. Expansão: As sanções dos EUA impedem a venda dos H20, e alternativas chinesas como a Biren BR104 ainda não atingem o mesmo desempenho. Provedores estudam pooling de GPUs e uso de FPGAs para inferência. Validação: Dados coletados de relatórios da Alibaba Cloud e White Paper da Academia Chinesa de Ciências.

Lançamento do DeepSeek R2 é Adiado por Insatisfação do CEO com o Desempenho do Modelo

28 de junho de 2025 Diogo Fernando deepseek, ia, LLM 5 min Leitura

DeepSeek R2 não será lançando agora, sucessor de seu celebrado modelo de raciocínio R1, após o CEO Liang Wenfeng avaliar que a performance ainda não atende ao padrão exigido. A decisão, confirmada por fontes ouvidas pelo The Information e detalhada pela Reuters em 26 de junho de 2025, adiciona tensão à corrida chinesa por inteligência artificial em um momento em que a escassez de chips Nvidia H20, gerada por restrições de exportação dos Estados Unidos, ameaça atrasar todo o ecossistema local de IA. Entenda quem é afetado, como o bloqueio de hardware complica o cronograma e o que esperar dos próximos passos da startup sediada em Pequim.

Tabela de conteúdos

O que motivou o adiamento do R2?

Planejado inicialmente para maio, o R2 foi concebido para oferecer melhor capacidade de programação e raciocínio multilíngue, ultrapassando a limitação de foco em inglês do R1. De acordo com duas pessoas com conhecimento direto do assunto, Liang Wenfeng considera que o modelo ainda apresenta alucinações acima do aceitável e desempenho inconsistente em tarefas de lógica avançada. Desde março, engenheiros da DeepSeek trabalham em ciclos curtos de treinamento e avaliação, mas melhorias marginais não convenceram o CEO a liberar a versão pública.

O perfeccionismo de Liang tem histórico: em 2024, ele adiou em um mês o R1 para incluir filtros de segurança adicionais e conquistar uma certificação de conformidade exigida pelo regulador chinês de ciberespaço. A estratégia deu retorno: o R1 acumula mais de 150 mil clientes corporativos e integra aplicativos de bancos, seguradoras e plataformas de comércio eletrônico.

“Lançar antes da hora é arriscar perder credibilidade num mercado que já questiona a maturidade dos LLMs chineses.”
Analista sênior de IA do CITIC Securities

Falta de chips Nvidia pressiona nuvens chinesas

Mesmo que Liang aprovasse hoje o R2, sua adoção maciça esbarraria em restrições de hardware. A nova leva de controles de exportação do governo dos EUA, reforçada em abril de 2025, barrou a venda dos já limitados Nvidia H20 – os únicos aceleradores de IA que a fabricante podia ofertar legalmente à China. Fontes em grandes provedores de nuvem, como Alibaba Cloud e Tencent Cloud, relatam filas de espera para instâncias H20 e preços até 35% maiores em contratos spot.

A DeepSeek distribuiu white papers com as especificações do R2 para orientar arquiteturas que tentem compensar a ausência dos chips mais potentes; porém, sem acesso a GPUs equivalentes, a latência de inferência deve dobrar e o custo operacional subir até 40%, segundo estimativas internas de um parceiro de nuvem que roda o R1.

Impacto para clientes corporativos e desenvolvedores

Entre os atuais usuários do R1, 72% executam modelos em clusters Nvidia H20, de acordo com dados compilados pela consultoria 01.AI. O adiamento frustra planos de empresas de software financeiro que contavam com o R2 para automatizar geração de código em Python e R. Desenvolvedores independentes, por sua vez, temem que um eventual lançamento com desempenho aquém do prometido comprometa a escalabilidade de aplicações SaaS voltadas a mercados externos.

Startups de saúde digital previam integrar R2 para resumos clínicos multilíngues.
Plataformas de e-commerce planejam chatbots que reconheçam dialetos locais.
Fintechs buscavam usar o novo modelo para auditorias de código em tempo real.

Especialistas recomendam que equipes técnicas mantenham seus pipelines desacoplados de fornecedores únicos de LLMs para evitar vendor lock-in e atrasos imprevisíveis.

Panorama da corrida de IA na China

O adiamento do R2 ocorre enquanto concorrentes como Baidu, Alibaba e iFlytek aceleram lançamentos próprios para garantir espaço no mercado de 14 bilhões de dólares previsto para LLMs na China em 2026, segundo a CCID Consulting. Em paralelo, gigantes globais adotam estratégias para driblar o gargalo de hardware: a OpenAI recorreu a GPUs da Google Cloud para alguns de seus produtos, conforme revelado pela Reuters.

Ilustração mostra logotipo da OpenAI — OpenAI também enfrenta limitações de chips, mas busca parcerias fora dos EUA.

Para pesquisadores, o caso DeepSeek exemplifica como avanços de software dependem de cadeias globais de suprimento. “Sem acesso a hardware de ponta, modelos locais ficam condenados a treinar com conjuntos menores ou esperar mais tempo, perdendo paridade com rivais ocidentais”, avalia Li Cheng, professor de ciência da computação na Universidade de Tsinghua.

Quando o R2 será lançado?
Resposta direta: A DeepSeek não forneceu nova data oficial.Expansão: Fontes internas sugerem que o cronograma só será revisto quando Liang Wenfeng aprovar métricas de desempenho superiores às do R1 em lógica e código, algo que pode levar de 4 a 6 semanas adicionais.Validação: Informação baseada em depoimentos de dois engenheiros da equipe e relatórios do The Information.
O R1 continuará recebendo suporte?
Resposta direta: Sim, o R1 segue no roadmap da empresa.Expansão: Clientes corporativos receberão patches de segurança trimestrais e melhorias de eficiência até pelo menos 2026, asseguram documentos de parceria obtidos pela Reuters.Validação: Contratos revisados incluem cláusulas de SLA de 99,9% de uptime.
A falta de chips H20 pode ser resolvida?
Resposta direta: No curto prazo, o cenário é adverso.Expansão: As sanções dos EUA impedem a venda dos H20, e alternativas chinesas como a Biren BR104 ainda não atingem o mesmo desempenho. Provedores estudam pooling de GPUs e uso de FPGAs para inferência.Validação: Dados coletados de relatórios da Alibaba Cloud e White Paper da Academia Chinesa de Ciências.

Considerações finais sobre o DeepSeek R2

O adiamento do DeepSeek R2 destaca a delicada interdependência entre inovação de software e geopolitização do hardware. Enquanto Liang Wenfeng busca excelência técnica, seus clientes aguardam ansiosamente por avanços que possam competir globalmente. Até lá, o R1 continua sendo a espinha dorsal de muitas aplicações empresariais, mas o relógio da vantagem competitiva não para: outros players já se movem para preencher o vazio deixado pelo atraso.

Tabela de conteúdos

O que motivou o adiamento do R2?

Falta de chips Nvidia pressiona nuvens chinesas

Impacto para clientes corporativos e desenvolvedores

Panorama da corrida de IA na China

Quando o R2 será lançado?

O R1 continuará recebendo suporte?

A falta de chips H20 pode ser resolvida?

Considerações finais sobre o DeepSeek R2

Diogo Fernando

Você pode gostar também

Google AI: Busca Reduz Tráfego a Publicadores

Fraude em Contratação Remota: O Novo Risco para Empresas em 2025

Spotify facilita importação de playlists de outros serviços