أطلقت شركة Moonshot AI في الثاني عشر من يونيو 2026 نموذج Kimi K2.7-Code، وهو خَلَف مفتوح الأوزان متخصص في البرمجة لنموذج Kimi K2.6، تقول الشركة إنه يحقق تحسناً بنسبة 21.8% على معيارها Kimi Code Bench v2 مع استهلاك أقل بنحو 30% من رموز الاستدلال. يأتي النموذج برخصة Modified MIT مع أوزان متاحة على Hugging Face، ما يضع برمجة وكيلة من الفئة المتقدمة في متناول الفرق التي تريد تشغيله على بنيتها التحتية الخاصة.
وهو الإصدار الخامس الكبير ضمن سلسلة K من Moonshot في أقل من عام، ويرسم موقفاً واضحاً: بدلاً من السعي وراء أكبر روبوت محادثة عام، تُركّز المختبر الذي يتخذ من بكين مقراً له على هندسة البرمجيات الوكيلة طويلة الأمد كبديل مفتوح الأوزان لنماذج البرمجة المغلقة.
أبرز النقاط
- نموذج mixture-of-experts بتريليون معامل مع 32 مليار معامل نشط لكل رمز، و384 خبيراً (8 مُختارة بالإضافة إلى 1 مشترك)، و61 طبقة.
- نافذة سياق 256 ألف رمز موجهة لسير العمل الوكيل الطويل متعدد الملفات.
- رخصة Modified MIT، مع أوزان (نحو 595 جيجابايت) على Hugging Face وتكميم INT4 أصلي لخفض كلفة النشر.
- يحقق +21.8% على Kimi Code Bench v2، و+11.0% على Program Bench، و+31.5% على MLS Bench Lite مقارنة بـK2.6.
- استهلاك أقل بنحو 30% من رموز الاستدلال مقارنة بـK2.6، ما يخفض كلفة المخرجات في المهام متعددة الخطوات.
التفاصيل
بُني K2.7-Code كشبكة mixture-of-experts (MoE): من إجمالي تريليون معامل، يُفعّل نحو 32 مليار فقط لأي رمز معين، ما يبقي كلفة الاستدلال أدنى بكثير مما يتطلبه نموذج كثيف بحجم مماثل. تجمع البنية بين انتباه MLA وطبقات SwiGLU التغذوية الأمامية، وتتضمن مُرمِّزاً بصرياً MoonViT بسعة 400 مليون معامل للمدخلات متعددة الوسائط. تقول Moonshot إن الأوزان يمكن تشغيلها عبر vLLM أو SGLang أو KTransformers، وإن تكميم INT4 الأصلي يهدف إلى جعل النشر المحلي أكثر يُسراً.
على معايير Moonshot الخاصة، تتمثل القفزة الأبرز في ارتفاع Kimi Code Bench v2 من 50.9 إلى 62.0. ويرتفع Program Bench من 48.3 إلى 53.6، بينما يقفز MLS Bench Lite، وهو اختبار متعدد اللغات، من 26.7 إلى 35.1. أما بالنسبة لاستخدام الأدوات والسلوك الوكيل، فتسجّل الشركة 81.1 على MCP Mark Verified (صعوداً من 72.8) و76.0 على MCP Atlas. وتدّعي Moonshot أيضاً أن K2.7-Code يتفوق على Claude Opus 4.8 في MCP Mark Verified، بينما يتأخر عن GPT-5.5 في معظم المقاييس.
أما بالنسبة للتسعير، فتُدرج واجهة Kimi API كلفة المدخلات عند فقدان التخزين المؤقت بـ0.95 دولار لكل مليون رمز، والمدخلات المخزّنة بـ0.19 دولار، والمخرجات بـ4.00 دولار لكل مليون رمز — أي أقل من معظم النماذج المغلقة المتقدمة لعمل برمجي مماثل.
ملاحظة حول الأرقام
تأتي جميع الأرقام المنشورة حتى الآن من معايير Moonshot الخاصة بها. حتى الثاني عشر من يونيو 2026، لم تكن هناك نتائج مستقلة من جهات خارجية لـK2.7-Code على المجموعات العامة القياسية مثل SWE-bench Verified أو SWE-bench Pro أو Terminal-Bench أو LiveCodeBench. المكاسب المُبلَّغ عنها من المُورّد لافتة، لكن الإصدار مفتوح الأوزان يعني أن المجتمع يستطيع الآن التحقق منها مباشرة — وهذا بالضبط جوهر إتاحة الأوزان.
الأثر
بالنسبة لفرق التطوير، تكمن الجاذبية في السيادة والكلفة. فنموذج برمجة مفتوح الأوزان وقابل للاستخدام التجاري يعمل على عتاد مملوك يتجنب فواتير واجهات برمجة التطبيقات لكل رمز، ويبقي الشيفرة المصدرية الخاصة بعيداً عن خوادم الأطراف الثالثة — وهو اعتبار مهم للمؤسسات الملتزمة بقواعد إقامة البيانات. ويُضاعف خفض رموز الاستدلال بنسبة 30% هذه الميزة عبر الحلقات الوكيلة الطويلة متعددة الخطوات التي باتت تهيمن على البرمجة المدعومة بالذكاء الاصطناعي.
كما يُبرز الإصدار اتجاهاً ميّز عام 2026: نماذج البرمجة الصينية مفتوحة الأوزان تُضيّق الفجوة باطراد مع الأنظمة الغربية المغلقة. وإلى جانب الدفعات مفتوحة المصدر الأخيرة من Cohere وسلسلة Qwen من Alibaba وZhipu، يزيد K2.7-Code الضغط على فرضية أن أقدر وكلاء البرمجة يجب أن يكونوا محتكَرين ومحجوبين خلف واجهات برمجية.
الخلفية
تأسست Moonshot AI عام 2023، وأطلقت سلسلة K بوتيرة سريعة، منتقلةً من K2 إلى K2.7-Code بين يوليو 2025 ويونيو 2026. أرست عائلة K2 سمعة المختبر في نماذج MoE الكبيرة المُحسّنة للمهام الوكيلة؛ ويُضيّق K2.7-Code هذا التركيز على هندسة البرمجيات تحديداً، مقايضاً بعض الشمولية بمكاسب قابلة للقياس على معايير البرمجة واستخدام الأدوات.
ما التالي
مع إتاحة الأوزان للعموم، يصبح الاختبار المباشر هو القياس المستقل على المجموعات القياسية التي لا تغطيها أرقام المُورّد بعد. وإذا صمد K2.7-Code في تقييمات من فئة SWE-bench، فإنه يعزز الحجة لصالح النماذج مفتوحة الأوزان كأساس افتراضي لوكلاء البرمجة المُستضافة ذاتياً — ويمنح فرق منطقة الشرق الأوسط وشمال إفريقيا مساراً آخر للبناء على الذكاء الاصطناعي دون الارتباط بمزوّد واجهة برمجية أجنبي واحد.
المصدر: MarkTechPost