in

En attendant le déblocage de Mythos, vous n’avez qu’à tester ce modèle open source de Z.ai

Modèle open source GLM-5.2

Alors que les restrictions géopolitiques se durcissent autour des technologies propriétaires de la Silicon Valley, la start-up chinoise Z.ai frappe un grand coup. En publiant un modèle gratuit aux performances comparables à celles de GPT-5.5, l’écosystème open source prouve qu’il peut rivaliser avec les modèles fermés les plus puissants du monde.

Dévoilé à la mi-juin 2026, le nouveau modèle de langage GLM-5.2 bouscule la hiérarchie mondiale de l’intelligence artificielle. 

Développé par Z.ai (ex-Zhipu AI), ce mastodonte technologique s’est hissé au sommet de l’Artificial Analysis Intelligence Index en faisant jeu égal avec GPT-5.5 et Claude Opus 4.8 sur les tâches de codage complexes. 

Il est d’ailleurs distribué sous licence MIT libre et auto-hébergeable. Et son lancement coïncide stratégiquement avec les récentes sanctions de Washington interdisant l’accès aux derniers modèles d’Anthropic à l’étranger.

Un timing géopolitique parfait pour bousculer le monopole américain

L’arrivée de GLM-5.2 sur le marché ne doit rien au hasard. Son lancement intervient au moment précis où Washington vient de bloquer l’accès à Claude Fable 5 et Mythos pour les utilisateurs situés hors des frontières américaines, forçant Anthropic à retirer ses deux modèles phares du marché international. 

Youtube video

Dans ce contexte de guerre froide technologique, l’émergence d’une intelligence artificielle de rang mondial, entièrement exécutable en local et exempte de restrictions géographiques, prend une dimension politique majeure.

Cette architecture à poids ouverts (open weights) répond à un besoin critique d’indépendance de la part des entreprises mondiales, de plus en plus réticentes à lier leur infrastructure à des API cloud américaines soumises aux caprices des régulateurs. 

Ce n’est donc pas un hasard si le modèle s’est retrouvé propulsé en tête des discussions de la communauté Hacker News.

Une mémoire colossale pour gérer des logiciels de bout en bout

Sur le plan technique, GLM-5.2 est un titan conçu pour les tâches de long horizon, comme l’exploration de dépôts de code complets ou la maintenance de logiciels sur plusieurs heures. 

Le modèle affiche 744 milliards de paramètres, dont environ 40 milliards sont activés dynamiquement à chaque requête. 

Sa fenêtre de contexte atteint désormais un million de tokens (cinq fois plus que la version précédente), permettant d’assimiler des bases de connaissances massives en une seule fois. 

Le framework, quant à lui, intègre deux modes de raisonnement natifs, « Max » et « High ». Ce qui nous laisse arbitrer entre une précision chirurgicale et une gestion optimisée des ressources de calcul.

Sur les bancs d’essai indépendants, les résultats valident la qualité de l’ingénierie de Z.ai. Le cabinet de référence Artificial Analysis lui attribue un score d’intelligence de 51, reléguant des concurrents comme DeepSeek V4 Pro et MiniMax-M3 au second plan. 

Et sur le benchmark IA FrontierSWE, qui évalue la résolution de problèmes d’ingénierie réels, GLM-5.2 atteint un taux de réussite de 74,4 %. Il devance ainsi GPT-5.5 (72,6 %) et talonnant Claude Opus 4.8 (75,1 %).

Perofrmances GLM-5.2 Z.ai
©z.ai

La gratuité totale pour les entreprises prêtes à l’héberger

La véritable force de GLM-5.2 réside dans sa stratégie de distribution. Publié sous licence MIT sur la plateforme Hugging Face, il offre une liberté totale. N’importe quelle organisation peut télécharger le code source, modifier le modèle, l’intégrer à ses produits et le commercialiser sans verser la moindre redevance à Z.ai. 

La seule barrière reste matérielle. Faire tourner localement une structure de 744 milliards de paramètres nécessite en effet une puissance de calcul de niveau industriel, excluant de fait les particuliers et les petites structures.

Pour pallier cette limite, Z.ai propose un accès via API à des tarifs agressifs qui risquent de déclencher une nouvelle guerre des prix dans la Silicon Valley. 

La firme facture 1,40 dollar par million de tokens en entrée et 4,40 dollars en sortie. À titre de comparaison, OpenAI exige 5 dollars en entrée et 30 dollars en sortie pour GPT-5.5.

Une nuance financière reste toutefois à surveiller. Le modèle chinois s’avère extrêmement verbeux dans ses phases de réflexion interne

Il génère en moyenne 43 000 tokens par tâche complexe (contre 24 000 pour ses concurrents directs). Le coût réel par tâche accomplie peut donc s’avérer plus élevé que prévu, même si l’avantage économique par rapport aux modèles fermés américains reste indiscutable.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !