GLM-5.2: o modelo aberto que bate o GPT-5.5 em código por 1/6 do custo
A chinesa Z.ai liberou, sob licença MIT, um modelo de 753 bilhões de parâmetros com contexto de 1 milhão de tokens que lidera os benchmarks de código de horizonte longo — e reacende a pergunta sobre quem realmente lidera a IA aberta.
Há um padrão que se repete em 2026: a cada poucas semanas, um laboratório chinês lança um modelo aberto que encosta — ou passa — o melhor modelo fechado do Ocidente, e cobra uma fração do preço. O GLM-5.2, da Z.ai, é a versão mais aguda desse padrão até agora. Lançado em 16 de junho de 2026 sob licença MIT, ele terminou o mês como o modelo em maior alta no Hugging Face, acumulando mais de três mil "likes" — a maior adesão da comunidade no período.
O detalhe que chamou atenção não foi só o desempenho, mas a combinação: pesos abertos, licença permissiva e resultados que, em código de horizonte longo, batem o GPT-5.5 gastando cerca de um sexto do custo.
O que há sob o capô
O GLM-5.2 tem 753 bilhões de parâmetros, mas não os usa todos de uma vez. É uma arquitetura Mixture-of-Experts (MoE) — mistura de especialistas —, em que apenas uma fração da rede, cerca de 40 bilhões de parâmetros, é ativada a cada token processado. Isso torna a inferência muito mais barata do que o tamanho total sugeriria: o modelo tem a capacidade de um gigante, mas o custo de rodar algo bem menor.
A janela de contexto útil chega a 1 milhão de tokens — espaço para engolir uma base de código inteira ou centenas de páginas de documentação numa só conversa. Para sustentar isso sem explodir o custo, a Z.ai introduziu o IndexShare: um indexador leve reaproveitado a cada quatro camadas de atenção esparsa, que corta as operações por token em 2,9× no contexto de 1 milhão. Atenção esparsa, aqui, significa que o modelo não compara cada token com todos os outros — ele foca só nos trechos relevantes, e é isso que torna o contexto gigante viável.
- Terminal-Bench 2.1: 81,0 — melhor modelo aberto do benchmark.
- SWE-bench Pro: 62,1, à frente do GPT-5.5 (58,6) e do próprio GLM-5.1 (58,4).
- Humanity's Last Exam (com ferramentas): 54,7 contra 52,2 do GPT-5.5.
- Artificial Analysis Intelligence Index: 51.
- Licença: MIT · disponível na API da Z.ai e em mais de 20 ambientes de código.
Onde ele realmente brilha
O GLM-5.2 não é o modelo mais inteligente do mundo em tudo — o índice geral de inteligência de 51 o coloca abaixo dos melhores fechados em raciocínio bruto. Sua força está em uma frente específica e economicamente valiosa: engenharia de software agêntica de horizonte longo. Ou seja, tarefas em que o modelo precisa navegar um repositório, editar vários arquivos, rodar testes e iterar por muitos passos até resolver um problema real.
Nessa categoria — benchmarks como FrontierSWE, PostTrainBench e SWE-Marathon —, o GLM-5.2 é o modelo aberto mais bem colocado. E nos números que mais interessam a quem paga a conta, ele supera o GPT-5.5: 62,1 contra 58,6 no SWE-bench Pro. Fazer isso por um sexto do custo transforma o cálculo de qualquer equipe que roda agentes de código em escala.
A realidade de rodar em casa
Pesos abertos não significam gratuitos de operar. Um modelo de 753 bilhões de parâmetros, mesmo em MoE, exige hardware que a maioria não tem em cima da mesa — falar em "self-hosting" do GLM-5.2 é falar em servidores com muitas GPUs de ponta. A licença MIT dá liberdade jurídica total para usar, modificar e comercializar; ela não paga a conta de energia nem a de VRAM.
Na prática, para a maior parte dos usuários, o GLM-5.2 será consumido via API — a da própria Z.ai ou de terceiros. O valor da abertura, aqui, é menos "rode no seu laptop" e mais "ninguém detém o monopólio deste modelo": ele pode ser hospedado por qualquer provedor, auditado e adaptado sem pedir licença a ninguém.
O que isso diz sobre a corrida
O GLM-5.2 reforça uma tese que 2026 vem confirmando: a distância entre os melhores modelos abertos e os fechados encolheu para semanas, não anos — e em nichos como código agêntico ela praticamente sumiu. Para o desenvolvedor, é a diferença entre depender de um fornecedor e poder escolher onde e como rodar. A pergunta deixou de ser "o aberto alcança o fechado?" e passou a ser "por quanto tempo o fechado justifica o preço?".
Perguntas Frequentes
O que quer dizer 753B de parâmetros com 40B ativos?
O GLM-5.2 é um modelo Mixture-of-Experts: tem 753 bilhões de parâmetros no total, mas ativa só cerca de 40 bilhões por token. Isso dá a capacidade de um modelo enorme com o custo de inferência de um bem menor.
Ele é melhor que o GPT-5.5?
Em código de horizonte longo, sim — supera o GPT-5.5 em benchmarks como SWE-bench Pro (62,1 contra 58,6) por cerca de um sexto do custo. Em inteligência geral, ainda fica atrás dos melhores modelos fechados.
Posso rodar o GLM-5.2 no meu computador?
Tecnicamente é possível, mas exige hardware pesado — muitas GPUs de ponta. Para a maioria, o caminho prático é a API da Z.ai ou de provedores terceiros. A licença MIT garante a liberdade de uso; não elimina o custo de infraestrutura.
O que é a licença MIT?
É uma das licenças de código aberto mais permissivas: permite usar, modificar, hospedar e comercializar o modelo livremente, sem royalties, desde que se preserve o aviso de copyright.