Alibaba lance Qwen3.7-Max et des puces personnalisées pour sa stratégie de fabrique IA complète

Alibaba a présenté Qwen3.7-Max lors de son Cloud Summit annuel à Hangzhou les 20 et 21 mai 2026, le positionnant comme son agent IA le plus avancé à ce jour et l'ancre de sa stratégie de « fabrique IA » couvrant l'ensemble de la chaîne, du silicium personnalisé jusqu'aux applications.

Points clés

Qwen3.7-Max dispose d'une fenêtre de contexte de 1 million de tokens, le double des 256 000 tokens de son prédécesseur Qwen3.6
Le modèle a exécuté plus de 1 000 appels d'outils autonomes lors d'un seul test interne
Il a démontré une exécution autonome continue pendant 35 heures sur des tâches de programmation complexes sans dégradation des performances
Il a atteint une amélioration de la vitesse d'inférence d'environ 10 fois sur des tâches d'optimisation de noyaux par rapport à la version précédente
Il est classé 5e au niveau mondial sur l'indice Artificial Analysis Intelligence avec un score de 56,6

La pile de trois produits

Alibaba a profité du sommet pour lancer trois produits interconnectés qui forment ensemble ce que la société appelle son infrastructure de fabrique IA.

Qwen3.7-Max constitue la couche modèle — un agent de raisonnement propriétaire à poids fermés, conçu pour les tâches longues. Avant de s'engager sur une réponse, le modèle génère une chaîne de réflexion interne, produisant environ 97 millions de tokens de raisonnement sur les benchmarks contre environ 24 millions pour les modèles comparables.

Zhenwu M890 est l'accélérateur IA sur mesure d'Alibaba, développé par sa filiale de semi-conducteurs T-Head et optimisé pour les charges de travail d'inférence importantes que nécessitent les modèles agents.

Panjiu AL128 est un serveur de format rack qui relie 128 accélérateurs M890 en une seule unité déployable, offrant la densité de calcul nécessaire pour soutenir des tâches autonomes de plusieurs heures à grande échelle.

Liu Weiguang, vice-président senior d'Alibaba Cloud, a résumé l'ambition clairement : la société contrôle désormais « les cinq couches de la pile IA complète — puces, infrastructure cloud, modèles IA, plateformes de services et applications ».

Résultats des benchmarks

Les évaluations indépendantes montrent des gains significatifs par rapport à la génération précédente :

CritPt : 13,4 % — hausse de 9,7 points de pourcentage
Humanity's Last Exam : 38,1 % — hausse de 9,2 points
Terminal-Bench Hard : 50,8 % — hausse de 6,9 points
GDPval-AA (Elo) : 1 546 — hausse de 42 points

Zhou Jingren, le nouveau directeur architecte IA d'Alibaba, a déclaré que le modèle « se classe constamment parmi les meilleurs » et surpasse les modèles IA chinois concurrents dans toutes les catégories.

Une limitation mérite toutefois d'être signalée : sur le benchmark AA-Omniscience, le taux de tentative du modèle est tombé à 48,0 % contre 67,3 %, indiquant que le modèle s'abstient davantage sur les tâches de rappel de connaissances incertaines plutôt que d'halluciner.

Contexte concurrentiel

Cette annonce intervient dans un contexte de concurrence accrue dans le secteur IA chinois. Tencent a lancé son assistant Mavis durant la même période, tandis que ByteDance a publié Seedance 2.0 pour la génération vidéo. Le pari d'intégration verticale d'Alibaba — contrôlant les puces via T-Head et l'infrastructure cloud via Alibaba Cloud — reproduit la stratégie de Nvidia et Google sur les marchés occidentaux.

Perspectives

Fin mai 2026, Qwen3.7-Max reste en accès préversion uniquement, avec un déploiement progressif de l'accès API sur Alibaba Cloud. La tarification n'a pas encore été annoncée ; son prédécesseur Qwen3.6 Max Preview était facturé 1,30 dollar par million de tokens en entrée et 7,80 dollars par million de tokens en sortie. Aucune version open source de Qwen3.7-Max n'a été publiée.

Source : Alibaba Cloud via MarkTechPost