écrits/news/2026/06
News13 juin 2026·6 min

Moonshot AI lance Kimi K2.7-Code, un modèle de codage open source à 1 000 milliards de paramètres

Moonshot AI a lancé Kimi K2.7-Code le 12 juin, un modèle de codage open weight de type mixture-of-experts à 1 000 milliards de paramètres avec une fenêtre de contexte de 256K, affichant un gain de 21,8% sur Kimi Code Bench v2 par rapport à K2.6 tout en consommant environ 30% de jetons de raisonnement en moins.

Moonshot AI a lancé Kimi K2.7-Code le 12 juin 2026, un successeur open weight de Kimi K2.6 axé sur le codage que l'entreprise présente comme affichant un gain de 21,8% sur son Kimi Code Bench v2 tout en consommant environ 30% de jetons de raisonnement en moins. Le modèle est distribué sous licence Modified MIT, avec des poids disponibles sur Hugging Face, mettant le codage agentique de pointe à la portée des équipes qui souhaitent l'exécuter sur leur propre infrastructure.

Il s'agit de la cinquième sortie majeure de la série K de Moonshot en moins d'un an, et elle adopte une position claire : plutôt que de courir après le plus grand agent conversationnel généraliste, le laboratoire basé à Pékin mise sur l'ingénierie logicielle agentique de long terme comme alternative open weight aux modèles de codage fermés.

Points clés

  • Modèle mixture-of-experts à 1 000 milliards de paramètres avec 32 milliards de paramètres actifs par jeton, 384 experts (8 sélectionnés plus 1 partagé) et 61 couches.
  • Fenêtre de contexte de 256K jetons destinée aux flux de travail agentiques longs et multi-fichiers.
  • Licence Modified MIT, avec des poids (environ 595 Go) sur Hugging Face et une quantification INT4 native pour un déploiement moins coûteux.
  • Affiche +21,8% sur Kimi Code Bench v2, +11,0% sur Program Bench et +31,5% sur MLS Bench Lite par rapport à K2.6.
  • Environ 30% de jetons de raisonnement en moins que K2.6, réduisant les coûts de sortie sur les tâches en plusieurs étapes.

Détails

K2.7-Code est conçu comme un réseau mixture-of-experts (MoE) : sur ses 1 000 milliards de paramètres au total, seuls environ 32 milliards s'activent pour un jeton donné, ce qui maintient le coût d'inférence bien en deçà de ce qu'exigerait un modèle dense de taille comparable. L'architecture associe l'attention MLA à des couches feed-forward SwiGLU et inclut un encodeur visuel MoonViT de 400 millions de paramètres pour les entrées multimodales. Moonshot indique que les poids peuvent être servis via vLLM, SGLang ou KTransformers, et que la quantification INT4 native vise à rendre le déploiement sur site plus abordable.

Sur les propres benchmarks de Moonshot, le bond le plus marquant est Kimi Code Bench v2, qui passe de 50,9 à 62,0. Program Bench monte de 48,3 à 53,6, et MLS Bench Lite, un test multilingue, bondit de 26,7 à 35,1. Pour l'utilisation d'outils et le comportement agentique, l'entreprise rapporte 81,1 sur MCP Mark Verified (contre 72,8) et 76,0 sur MCP Atlas. Moonshot affirme également que K2.7-Code devance Claude Opus 4.8 sur MCP Mark Verified, tout en restant derrière GPT-5.5 sur la plupart des mesures.

Côté tarif, l'API Kimi affiche l'entrée en cas d'absence de cache à 0,95 dollar par million de jetons, l'entrée mise en cache à 0,19 dollar, et la sortie à 4,00 dollars par million de jetons — soit moins que la plupart des modèles fermés de pointe pour un travail de codage comparable.

Une réserve sur les chiffres

Tous les chiffres publiés à ce jour proviennent des benchmarks propriétaires de Moonshot. Au 12 juin 2026, il n'existait aucun résultat indépendant de tiers pour K2.7-Code sur les suites publiques standard telles que SWE-bench Verified, SWE-bench Pro, Terminal-Bench ou LiveCodeBench. Les gains annoncés par le fournisseur sont notables, mais la diffusion open weight signifie que la communauté peut désormais les valider directement — ce qui est précisément l'intérêt de publier les poids.

Impact

Pour les équipes de développement, l'attrait réside dans la souveraineté et le coût. Un modèle de codage open weight, utilisable commercialement et fonctionnant sur du matériel propre, évite les factures d'API au jeton et garde le code source propriétaire hors des serveurs de tiers — une considération importante pour les organisations soumises à des règles de résidence des données. La réduction de 30% des jetons de raisonnement amplifie cet avantage à travers les longues boucles agentiques en plusieurs étapes qui dominent désormais le codage assisté par l'IA.

La sortie accentue aussi une tendance qui a défini 2026 : les modèles de codage chinois open weight comblent régulièrement l'écart avec les systèmes occidentaux fermés. Aux côtés des récentes initiatives open source de Cohere, de la gamme Qwen d'Alibaba et de Zhipu, K2.7-Code accroît la pression sur l'idée que les agents de codage les plus performants doivent être propriétaires et verrouillés derrière une API.

Contexte

Fondée en 2023, Moonshot AI a déployé sa série K à un rythme soutenu, passant de K2 à K2.7-Code entre juillet 2025 et juin 2026. La famille K2 a établi la réputation du laboratoire pour ses grands modèles MoE optimisés pour les tâches agentiques ; K2.7-Code resserre ce focus spécifiquement sur l'ingénierie logicielle, troquant une part de généralité contre des gains mesurables sur les benchmarks de codage et d'utilisation d'outils.

Et ensuite

Les poids étant publics, le test immédiat sera l'évaluation indépendante sur les suites standard que les chiffres du fournisseur ne couvrent pas encore. Si K2.7-Code tient ses promesses sur des évaluations de type SWE-bench, cela renforce l'argument en faveur des modèles open weight comme substrat par défaut des agents de codage auto-hébergés — et offre aux équipes de la région MENA une autre voie pour construire sur l'IA sans se verrouiller chez un unique fournisseur d'API étranger.


Source : MarkTechPost