Z.ai lance GLM-5.2, un modèle open-weights de 753 milliards de paramètres. Il se trouve en tête de l’Artificial Analysis Intelligence Index. GLM 5.2 code concurrence désormais GPT-5.5 et Claude Opus 4.8.
La startup chinoise Z.ai, connue sous le nom de Zhipu AI, a annoncé la disponibilité immédiate de GLM-5.2. Ce modèle à poids ouvert compte 753 milliards de paramètres. Selon Z.ai, il cible les tâches de développement logiciel autonome de longue durée. Il est désormais accessible sur Hugging Face et sur plus de 20 environnements de codage tiers dès sa publication.
IndexShare : l’innovation qui réduit le calcul par token de 2,9 fois
GLM-5.2 intègre une optimisation architecturale interne appelée « IndexShare ». Dans les grands modèles de langage classiques, recalculer les mécanismes d’attention sur de longs documents mobilise d’importantes ressources. IndexShare résout ce problème en utilisant le même indexeur pour chaque groupe de quatre couches d’attention sparse. Selon Z.ai, cette méthode réduit les opérations de calcul par token de 2,9 fois à la longueur maximale de contexte d’un million de tokens.
Le modèle intègre également une couche Multi-Token Prediction (MTP) améliorée. Il augmente la longueur des tokens acceptés de 20 % lors de l’inférence, toujours selon Z.ai. Par ailleurs, deux modes de raisonnement sont disponibles. Le mode « Max » est pour les tâches complexes, et « High » réduit de moitié l’usage des tokens sans sacrifier trop de performance.
GLM-5.2 dépasse-t-il GPT-5.5 sur les benchmarks de codage ?
Sur plusieurs tests, oui. Sur SWE-bench Pro, GLM-5.2 obtient un score de 62,1, devant GPT-5.5 (58,6), selon les données publiées par Z.ai. Sur FrontierSWE, conçu pour évaluer les tâches longues, le modèle atteint 74,4 %, contre 72,6 % pour GPT-5.5 et 75,1 % pour Claude Opus 4.8. Sur PostTrainBench, qui simule des charges de travail sur plusieurs heures, GLM-5.2 marque 34,3 % contre 25,0 % pour GPT-5.5, selon Z.ai.
Introducing GLM-5.2: Frontier Intelligence, Open Weights
— Z.ai (@Zai_org) June 16, 2026
– Significant improvements in coding and agentic tasks
– Strong long-horizon capabilities with a 1M context window
– Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong… pic.twitter.com/SjGPSVhePJ
En revanche, sur Terminal-Bench 2.1, GPT-5.5 (84,0) et Claude Opus 4.8 (85,0) conservent un avantage sur GLM-5.2 (81,0). GLM 5.2 code se distingue toutefois sur Design Arena, un benchmark participatif, où il atteint un score ELO de 1360, devant Claude Fable 5.
La licence MIT offre-t-elle vraiment plus de liberté aux entreprises ?
Oui, bien plus que la plupart des licences alternatives. Z.ai publie les poids de GLM-5.2 sous licence MIT. Cette licence permet en effet aux entreprises d’utiliser, de modifier et de commercialiser le modèle sans payer de redevances. La documentation de Z.ai indique explicitement que cette licence garantit « aucune restriction régionale » et « un accès technique sans frontières ».
Ce positionnement s’inscrit dans la course à l’IA entre la Chine et les États-Unis. Une directive de l’administration Trump a interdit aux ressortissants étrangers d’accéder au modèle Claude Fable 5 d’Anthropic la semaine qui précède la publication. L’entreprise a temporairement retiré les modèles concernés de l’ensemble de ses plateformes. La Chine, qui finance massivement l’IA, voit dans ce type de modèle un levier stratégique face aux restrictions américaines.
Une tarification compétitive face aux modèles propriétaires américains
L’accès à l’API est facturé 1,40 dollar par million de tokens en entrée et 4,40 dollars en sortie, selon Z.ai. À titre de comparaison, Claude Opus 4.8 d’Anthropic coûte 25 dollars par million de tokens en sortie. GPT-5.5 d’OpenAI coûte 30 dollars, d’après un tableau de tarification publié par VentureBeat.
Z.ai propose aussi le GLM Coding Plan, à partir de 12,60 dollars par mois (plan Lite), puis 50,40 dollars (plan Pro) et 112 dollars (plan Max). Ces formules sont compatibles avec des outils tiers comme Cline ou Kilo Code. Ce dernier a confirmé l’intégration dès le premier jour selon les publications sur X. GLM-5.2 fonctionne dans Kilo Code dès sa sortie. La fenêtre de contexte 1M et le mode Max sont tous deux actifs. Z.ai, premier tigre chinois de l’IA à s’être coté en bourse à Hong Kong. Cela positionne ainsi GLM-5.2 comme une alternative ouverte aux grands modèles propriétaires américains.
- Partager l'article :
