GLM-5.2 de Z.ai bat GPT-5.5 sur les tests de programmation au sixième du coût

Le laboratoire chinois d'IA Z.ai — anciennement connu sous le nom de Zhipu, l'un des « six tigres » de l'intelligence artificielle du pays — a lancé GLM-5.2 à la mi-juin 2026, un modèle à poids ouverts sous licence MIT qui égale ou dépasse le GPT-5.5 d'OpenAI sur plusieurs tests de programmation de longue haleine pour un coût d'exécution environ six fois moindre. Le lancement est devenu l'une des actualités IA les plus commentées du mois, des chercheurs le décrivant comme un véritable saut qualitatif pour les modèles ouverts.

Points clés

GLM-5.2 est un modèle de type mélange d'experts (Mixture-of-Experts) comptant environ 753 milliards de paramètres au total et près de 40 milliards actifs par jeton, conçu pour l'ingénierie logicielle agentique plutôt que pour la conversation.
Il est distribué sous licence MIT permissive, avec des poids disponibles sur Hugging Face et ModelScope et une API compatible avec OpenAI et Anthropic.
Une fenêtre de contexte d'un million de jetons est disponible en option, aux côtés de modes d'effort de raisonnement sélectionnables.
Le tarif de l'API avoisine 1,40 dollar par million de jetons en entrée et 4,40 dollars par million en sortie — soit environ un sixième des tarifs de Fable 5, fixés à 10 et 50 dollars.

Détails

GLM-5.2 est conçu pour le travail de programmation agentique long et multi-étapes plutôt que pour la conversation. Son architecture de mélange d'experts n'active qu'environ 40 milliards de ses quelque 753 milliards de paramètres par jeton, ce qui maintient des coûts d'inférence faibles. Le modèle utilise un nouveau mécanisme d'attention parcimonieuse que Z.ai appelle IndexShare, qui réutilise les indexeurs d'attention à travers les couches ; selon l'entreprise, cela réduit le calcul par jeton d'environ 2,9 fois pour un contexte d'un million de jetons. Le modèle s'appuie également sur la prédiction multi-jetons pour accélérer la génération.

Sur les tests, GLM-5.2 obtient un score dans le bas de la soixantaine sur SWE-bench Pro et environ 81 sur Terminal-Bench 2.1, avec un résultat proche de 74 pour cent sur FrontierSWE. Sur plusieurs tâches de programmation de longue haleine, il devance GPT-5.5 tout en restant légèrement en dessous du Claude Opus 4.8 d'Anthropic. Sur la plateforme communautaire Design Arena, les premiers testeurs l'ont classé premier, devant Claude Fable pour les tâches de conception d'interfaces front-end.

Impact

Ce qui a rendu ce lancement si marquant, c'est la combinaison de scores de programmation de premier plan, d'une licence MIT sans restriction et d'une tarification représentant une fraction de celle des concurrents fermés. Un modèle ouvert qui bat GPT-5.5 sur de vrais tests d'ingénierie logicielle pour environ un sixième du coût n'était, comme l'a formulé un analyste, « pas censé exister encore ». Pour les développeurs et les entreprises, cela signifie une alternative crédible et auto-hébergeable aux modèles fermés de pointe pour les pipelines de programmation agentique.

Cette économie revêt une importance particulière pour la région MENA. Un modèle sous licence MIT, sans restriction régionale, peut être déployé sur une infrastructure privée, aidant les organisations à respecter les exigences de résidence et de souveraineté des données dans des cadres tels que l'INPDP tunisien et le PDPL saoudien, sans envoyer de code source ni de données sensibles à une API tierce.

Contexte

Le lancement de Z.ai prolonge une tendance où les laboratoires ouverts chinois accusent un retard d'environ six à neuf mois sur les modèles fermés américains de pointe, tout en publiant leurs poids publiquement. Des observateurs ont comparé ce moment à la démonstration antérieure de DeepSeek R1, qui avait prouvé que les laboratoires ouverts pouvaient reproduire un raisonnement avancé, soulignant que GLM-5.2 va plus loin en se comportant de manière crédible comme un agent généraliste au sein d'outils de programmation populaires tels que Claude Code, OpenClaw et Cline.

La suite

L'évaluation indépendante demeure la grande inconnue. Les analystes avertissent que plusieurs chiffres de tests qui circulent sont communiqués par l'éditeur ou précoces, et conseillent aux équipes de tester GLM-5.2 sur leurs propres dépôts avant de s'engager. Z.ai a laissé entrevoir des ambitions plus élevées, des commentaires suggérant que le laboratoire prévoit une sortie de la classe « Open Fable » d'ici la fin de l'année — un indicateur de la rapidité avec laquelle la frontière des poids ouverts comble son retard sur les leaders propriétaires.

Source : VentureBeat