مونشوت الصينية تطلق Kimi K2.6: نموذج مفتوح المصدر يضاهي Claude Opus 4.6 ويقود أسراباً من 300 عميل ذكاء اصطناعي

أطلق مختبر مونشوت للذكاء الاصطناعي ومقرّه بكين نموذج Kimi K2.6، وهو نموذج مفتوح الأوزان بحجم تريليون بارامتر يتصدّر جميع النماذج الحدودية على اختبار Humanity's Last Exam مع الأدوات، ويتفوّق بفارق ضيّق على GPT-5.4 في اختبار SWE-Bench Pro. صدر النموذج يوم 20 أبريل 2026 برخصة MIT المعدّلة، وأصبح متاحاً فوراً عبر موقع Kimi.com وتطبيق Kimi وواجهة برمجة التطبيقات الرسمية وأداة Kimi Code CLI، ليقلّص الفجوة بين النماذج الصينية مفتوحة المصدر والأنظمة الغربية المملوكة إلى بضع نقاط فقط.
أبرز النقاط
- 58.6 نقطة على SWE-Bench Pro، متقدّماً على GPT-5.4 بـ57.7 وClaude Opus 4.6 بـ53.4 وGemini 3.1 Pro بـ54.2
- 54.0 على HLE-Full مع الأدوات — وهي أعلى نتيجة بين جميع النماذج الحدودية المُقاسة
- أسراب عملاء قادرة على تشغيل 300 عميل فرعي عبر 4000 خطوة منسّقة، مقارنة بـ100 عميل و1500 خطوة في الإصدار السابق K2.5
- نافذة سياق بحجم 256 ألف رمز، مع تريليون بارامتر كلي و32 مليار نشط لكل رمز عبر بنية MoE بـ384 خبيراً
- أوزان مفتوحة على Hugging Face برخصة MIT المعدّلة تسمح بالاستخدام التجاري
أداء المعايير القياسية
يسجّل Kimi K2.6 أقوى الأرقام حتى الآن لنموذج مفتوح الأوزان في مهام البرمجة العميلة. يصل النموذج إلى 80.2 على SWE-Bench Verified، و76.7 على SWE-bench Multilingual، و89.6 على LiveCodeBench v6 متجاوزاً Claude Opus 4.6 الذي سجّل 88.8. أما على Terminal-Bench 2.0 فبلغ 66.7، وعلى BrowseComp 86.3، وكلاهما قفزة كبيرة عن نسخة K2.5 التي أُطلقت في وقت سابق من هذا العام.
النتيجة الأبرز تأتي من اختبار Humanity's Last Exam مع الأدوات، حيث يتصدّر K2.6 الترتيب بـ54.0 مقابل 52.1 لـGPT-5.4 و53.0 لـClaude Opus 4.6 و51.4 لـGemini 3.1 Pro. وعلى SWE-Bench Pro، وهو اختبار مصمَّم لمقاومة تسرّب البيانات، يبتعد K2.6 عن Claude Opus 4.7 بنقطة واحدة فقط — وهو أقرب ما وصل إليه أي نموذج مفتوح المصدر من أحدث نماذج Anthropic.
البنية والمواصفات التقنية
تحت الغطاء، يعتمد K2.6 على بنية Mixture-of-Experts بإجمالي 384 خبيراً — يُختار ثمانية منهم لكل رمز بالإضافة إلى خبير مشترك — مع تنشيط 32 مليار بارامتر من أصل تريليون. تستخدم البنية 61 طبقة، وأبعاد انتباه مخفية بقيمة 7168، و64 رأس انتباه. أما الفهم متعدد الوسائط فيوفّره مشفّر الرؤية MoonViT بحجم 400 مليون بارامتر المدمج مباشرة داخل النموذج.
تدعم نافذة السياق البالغة 256 ألف رمز عمليات العملاء طويلة الأمد، وتوصي مونشوت بنشر النموذج عبر vLLM أو SGLang أو KTransformers مع إصدار transformers 4.57.1 أو أحدث. يُطلق النموذج بوضعَي تشغيل: وضع التفكير للاستدلال الممتد، ووضع الفوري للاستجابات السريعة.
أسراب العملاء والعمل طويل الأمد
الرهان المعماري الأهم هو على النطاق العميل. يأتي K2.6 مع قدرة تشغيل 300 عميل فرعي بالتوازي عبر 4000 خطوة منسّقة — أي ثلاثة أضعاف عدد العملاء الفرعيين وأكثر من ضعف ميزانية الخطوات مقارنة بـK2.5. كذلك طرحت مونشوت ميزة Claw Groups لتنسيق العملاء متعددي الأنواع، مما يسمح لـK2.6 بتنسيق عملاء من طرف ثالث جنباً إلى جنب مع عملائه الأصليين.
في العروض التوضيحية، عمل K2.6 بشكل مستقل على تحسين محرّك مطابقة مالي خلال جلسة متواصلة استمرّت 13 ساعة، محقّقاً تحسيناً بنسبة 185 بالمئة في الإنتاجية. وفي عرض منفصل، شُغّل النموذج لمدة خمسة أيام متواصلة على مهام إدارة البنية التحتية. كما يستطيع K2.6 استيعاب ملفات PDF وجداول البيانات والعروض التقديمية وتحويلها إلى "مهارات" قابلة لإعادة الاستخدام، وهي ميزة تعكس معيار المهارات الذي يكتسب زخماً في منظومة عملاء البرمجة.
الأثر على سباق النماذج المفتوحة
يأتي الإعلان في لحظة محورية للذكاء الاصطناعي مفتوح المصدر. من المتوقع أن تُطلق DeepSeek الإصدار V4 خلال الأسابيع القادمة، فيما تواصل Qwen من علي بابا وGLM-5 من Zhipu تقليص الفجوة مع المختبرات الغربية. يُعدّ Kimi K2.6 الآن أقوى نموذج عملاء برمجة مفتوح الأوزان متاح، وترخيصه MIT المعدّل يعني أن المطوّرين والشركات الناشئة والمؤسسات يمكنهم نشره دون الارتباط بمزوّد معيّن.
بالنسبة للفرق الحسّاسة للتكلفة، يسعّر اشتراك Kimi Code النموذجَ المُستضاف بـ39 يوان شهرياً — أي نحو ربع سعر الفئات المقابلة من Claude أو GPT-5 للبرمجة. إلى جانب دعم التكامل مع Cursor وCline وOpenClaw وأُطر العملاء الأخرى، فإن المبرّر الاقتصادي لعملاء البرمجة مفتوحي الأوزان بات صعب التجاهل.
ماذا بعد
أشارت مونشوت إلى أن K2.6 هو أساس منصّة عملاء أوسع وليس إصداراً فردياً. ومن المتوقّع رؤية عروض تشغيل مستقلّ أطول تدريجياً، وتكاملات أعمق لـClaw Groups، وكتالوج متزايد من المهارات القابلة للمشاركة. بالنسبة لمسؤولي المعلومات وقادة الهندسة في منطقة الشرق الأوسط وشمال أفريقيا، الرسالة واضحة: تكلفة تشغيل عميل برمجة قريب من النماذج الحدودية على بنيتك التحتية الخاصة انخفضت مجدّداً هذا الأسبوع.
المصدر: MarkTechPost
ناقش مشروعك معنا
نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.
دعنا نجد أفضل الحلول لاحتياجاتك.