NoticiasInteligência ArtificialTecnologia

GLM-5.2: Z.ai lança modelo aberto com 1M tokens

PUBLICIDADE

A Z.ai lançou o GLM-5.2, seu novo modelo de texto com pesos abertos, janela de contexto de 1 milhão de tokens e foco direto em agentes de programação, depuração, refatoração e desenvolvimento de software em escala de projeto. O anúncio foi feito em junho de 2026 e posiciona o modelo como uma alternativa para equipes que precisam analisar repositórios inteiros, manter decisões técnicas ao longo de sessões longas e executar tarefas complexas com maior continuidade.

O que muda com o GLM-5.2

O principal destaque do GLM-5.2 é a capacidade de trabalhar com até 1M de tokens de contexto e gerar até 128 mil tokens de saída. Na prática, isso permite que um agente de IA leia grandes volumes de código, documentação, contratos de API, histórico de decisões, regras de engenharia e limites entre arquivos sem perder rapidamente o fio da tarefa.

Segundo a Z.ai, o modelo foi treinado para cenários de long-horizon coding agents, expressão usada para descrever agentes capazes de executar tarefas prolongadas, como implementação em larga escala, pesquisa automatizada, otimização de desempenho, debugging complexo e geração de vídeo orientada por código.

PUBLICIDADE
Publicação oficial da Z.ai anunciando o GLM-5.2 com pesos abertos e contexto de 1 milhão de tokens.

Disponibilidade para desenvolvedores e agentes de código

O GLM-5.2 está disponível para usuários do GLM Coding Plan nos planos Lite, Pro e Max. A empresa também informa suporte de troca de modelo dentro de agentes de codificação como Claude Code, OpenClaw e Cline, por meio de configuração personalizada.

Para ativar a versão com janela de contexto de 1 milhão de tokens, os desenvolvedores podem usar o nome de modelo glm-5.2[1m]. A Z.ai também oferece endpoint compatível com a API da OpenAI, facilitando integrações em ferramentas internas, fluxos de CI, assistentes de programação e ambientes de desenvolvimento já existentes.

Desempenho em benchmarks de programação

A Z.ai afirma que o avanço não se limita ao tamanho do contexto. Em testes citados pela empresa, o GLM-5.2 fica apenas 1 ponto percentual atrás do Claude Opus 4.8 no FrontierSWE, supera GPT-5.5 e Opus 4.7 em múltiplos benchmarks de tarefas longas e melhora resultados em avaliações técnicas de terminal e correção de software.

BenchmarkResultado citadoComparação
Terminal-Bench 2.181,0 pontosGLM-5.1 marcou 62,0
SWE-bench Pro62,1 pontosGLM-5.1 marcou 58,4
FrontierSWE1 ponto atrás do Claude Opus 4.8Acima de rivais em testes longos, segundo a Z.ai
Benchmark do GLM-5.2 em programação, terminal e tarefas longas de IA
Resultados divulgados pela Z.ai destacam ganhos em tarefas de programação e execução prolongada.

Arquitetura: IndexShare, atenção esparsa e FP8

Para tornar viável a inferência com contexto tão longo, a Z.ai diz ter adotado o IndexShare, um método de atenção esparsa que reutiliza o mesmo indexador a cada quatro camadas de sparse-attention. De acordo com a companhia, essa abordagem reduz em 2,9 vezes os FLOPs por token quando o modelo opera no limite de 1 milhão de tokens.

Outro ajuste está na camada MTP, usada para speculative decoding. A empresa afirma que a atualização aumenta o comprimento aceito em até 20%, o que pode melhorar a velocidade percebida em respostas extensas. Listagens no Hugging Face e no ModelScope apontam versões GLM-5.2 e GLM-5.2-FP8 com 744 bilhões de parâmetros totais e 40 bilhões de parâmetros ativos.

Por que o contexto de 1M tokens importa

Em chatbots comuns, uma janela de contexto maior ajuda a lembrar conversas longas. Em agentes de código, porém, o impacto é mais profundo. Um agente precisa entender arquitetura, dependências, testes, documentação, logs de execução e regras de produção antes de alterar uma base real. Quando o contexto é curto, ele tende a esquecer restrições, repetir decisões ou propor mudanças inconsistentes.

Com 1M de tokens, o GLM-5.2 mira fluxos de trabalho como revisão de repositório completo, migração de aplicações, análise de bugs intermitentes, execução com ADB, leitura de logcat, uso de capturas de tela, depuração em dispositivo real e modernização de Mini Programs. Essa orientação mostra que a Z.ai pretende disputar infraestrutura de agentes, não apenas lançar mais um chatbot.

Z.ai, antiga ZhipuAI, mira infraestrutura aberta

A Z.ai, anteriormente conhecida como ZhipuAI, nasceu em 2019 a partir de trabalhos tecnológicos ligados à Universidade Tsinghua. A empresa é responsável pela família GLM, incluindo GLM-130B, ChatGLM, GLM-4, GLM-4-Voice e AutoGLM. Segundo a companhia, o ChatGLM-6B já ultrapassou 20 milhões de downloads globais.

Esse histórico ajuda a explicar a estratégia do GLM-5.2: transformar pesquisa em modelos abertos em ferramentas práticas para desenvolvedores, empresas e equipes de engenharia. A combinação de pesos abertos, API compatível, builds FP8 e foco em agentes pode atrair quem busca mais controle sobre implantação, custo e privacidade.

“O GLM-5.2 traz melhorias significativas em tarefas de codificação e agentes, além de forte capacidade de longo horizonte com janela de contexto de 1M.”

Z.ai, em anúncio oficial do modelo

Limitações e pontos de atenção

Apesar dos números promissores, benchmarks divulgados pelo próprio fornecedor devem ser lidos com cautela. Resultados reais dependem de custo de inferência, latência, qualidade dos prompts, integração com ferramentas, segurança do ambiente e validação humana das alterações de código. Em produção, agentes de IA ainda exigem revisão, testes automatizados e políticas claras de acesso a repositórios.

O GLM-5.2 se destaca por unir contexto de 1 milhão de tokens, pesos abertos e foco prático em agentes de código para projetos de software complexos.

Perguntas frequentes sobre o GLM-5.2

  1. O que é o GLM-5.2?

    É um modelo de texto da Z.ai com pesos abertos, contexto de 1M tokens e foco em agentes de código, depuração e tarefas longas de software.

  2. Para que serve a janela de contexto de 1M tokens?

    Ela permite analisar repositórios, documentação, logs e regras de engenharia em uma mesma sessão, reduzindo perda de contexto em tarefas complexas.

  3. O GLM-5.2 funciona com ferramentas de programação?

    Sim. A Z.ai cita uso com Claude Code, OpenClaw e Cline via configuração personalizada, além de endpoint compatível com a API da OpenAI.

  4. Quais são os principais benchmarks do GLM-5.2?

    A empresa cita 81,0 no Terminal-Bench 2.1, 62,1 no SWE-bench Pro e desempenho próximo ao Claude Opus 4.8 no FrontierSWE.

Considerações finais

O lançamento do GLM-5.2 reforça a corrida por modelos abertos capazes de operar como infraestrutura para agentes de IA. A proposta da Z.ai é clara: oferecer um modelo com contexto massivo, raciocínio ajustável, bom desempenho em programação e integração com fluxos usados por desenvolvedores. Se os resultados se confirmarem fora dos benchmarks internos, o modelo pode se tornar uma opção relevante para equipes que trabalham com bases de código extensas e automação avançada.

Fonte

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.