Kimi K2.7 Code: دليل البرمجة الوكيلة الموفّرة للرموز

في الثاني عشر من يونيو 2026، أطلقت Moonshot AI نموذج Kimi K2.7 Code — وهو خامس إصدار رئيسي لها في أقل من عام، والأول الذي يحمل اسماً يحدّد مهمته بوضوح: البرمجة الوكيلة. العنوان الأبرز ليس تتويجاً في اختبار الأداء، بل رقم يهمّ من يدفع الفاتورة أكثر مما يهمّ متابعي لوحات الصدارة: تقليص نحو 30٪ من رموز الاستدلال مقارنة بالإصدار السابق K2.6، وبالسعر نفسه لكل رمز.

بالنسبة للمطوّرين الذين يشغّلون وكلاء البرمجة في حلقات متكرّرة — حيث قد تتفرّع المهمة الواحدة إلى عشرات استدعاءات الأدوات وآلاف رموز "التفكير" — يتراكم هذا التوفير سريعاً. يشرح هذا الدليل ما الذي تغيّر، وكيف تدمج K2.7 Code في منظومتك، وأين يصلح فعلاً مقابل النماذج المغلقة الرائدة.

ما هو Kimi K2.7 Code فعلاً

K2.7 Code نموذج من نوع مزيج الخبراء (MoE) يبلغ مجموع معاملاته تريليون معامل، لكن النشط منها 32 مليار فقط لكل رمز. هذه التشتّتية هي الحيلة كلّها: تحصل على سعة المعرفة لنموذج عملاق بينما تدفع تكلفة استدلال أقرب إلى نموذج كثيف بحجم 32 مليار.

البنية بالأرقام المجرّدة:

384 خبيراً، يُختار منها 8 إضافة إلى خبير مشترك واحد لكل رمز
61 طبقة، مع آلية الانتباه الكامن متعدّد الرؤوس (MLA)
مفردات بحجم 160 ألف رمز
نافذة سياق بحجم 256 ألف رمز (262,144 رمزاً)
رخصة MIT معدّلة — أوزان مفتوحة قابلة للاستضافة الذاتية
معرّف النموذج: kimi-k2.7-code؛ والأوزان على moonshotai/Kimi-K2.7-Code في Hugging Face

هناك قرار تصميمي يجب أن تعرفه قبل البناء: الاستدلال إلزامي. يفكّر K2.7 Code دائماً، ويحافظ خيار preserve_thinking على سلسلة الاستدلال الكاملة عبر المحادثات متعدّدة الأدوار. لا يوجد مفتاح لإيقاف الاستدلال في المهام التافهة. المقايضة التي اختارتها Moonshot هي أن النموذج يبالغ في التفكير بدرجة أقل في كل خطوة — ومن هنا تقليص 30٪ من الرموز — بدلاً من السماح لك بتخطّي التفكير كلياً.

الأرقام، والتحفّظ المهم

تذكر Moonshot مكاسب قوية مقارنة بـK2.6 عبر مجموعاتها الداخلية:

الاختبار	K2.6	K2.7 Code
Kimi Code Bench v2	50.9	62.0
Program Bench	48.3	53.6
MLS Bench Lite	26.7	35.1
MCP Atlas	69.4	76.0
MCP Mark Verified	72.8	81.1

تبرز المكاسب الخاصة ببروتوكول MCP: هذا نموذج مضبوط لأجل استدعاء الأدوات، لا لإكمال الكود فقط. القفزة إلى 81.1٪ في MCP Mark Verified (الاستدعاء الصحيح للأدوات عبر بروتوكول سياق النموذج) هي الرقم الأكثر صلة بالعمل الوكيلي هنا.

أمّا الجزء الصادق: كل هذه الاختبارات مجموعات خاصة بـMoonshot. حتى تاريخ الإطلاق، لم تكن هناك نتائج مستقلّة من طرف ثالث على مجموعات عامة معيارية مثل SWE-bench Verified أو LiveCodeBench أو Terminal-Bench. تعامل مع النتائج باعتبارها مُعلَنة من المورّد واسترشادية. ادّعاء الكفاءة أسهل في التحقّق ضمن سجلّاتك أنت — إذ يمكنك قياس استهلاك الرموز على حِملك مباشرة — لذا فهو الرقم الجدير بالاختبار أولاً.

دمجه في منظومتك

يوفّر K2.7 Code نقطتي وصول متوافقتين مع OpenAI ومع Anthropic، ما يعني أن معظم أدوات الوكلاء القائمة تعمل بمجرّد تبديل متغيّر بيئة.

واجهة API متوافقة مع OpenAI

from openai import OpenAI
 
client = OpenAI(
    api_key="sk-...",
    base_url="https://api.moonshot.ai/v1",
)
 
resp = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "أعد هيكلة هذا الملف وأضف اختبارات وحدة."}
    ],
)
print(resp.choices[0].message.content)

نقطة وصول متوافقة مع Anthropic لوكلاء البرمجة

إن كنت تشغّل Claude Code أو Cline أو Roo Code، وجّهها إلى عنوان Moonshot المتوافق مع Anthropic — دون أي تعديل في الكود، فقط متغيّرات بيئة:

export ANTHROPIC_BASE_URL=https://api.moonshot.ai/anthropic
export ANTHROPIC_MODEL=kimi-k2.7-code
export ANTHROPIC_API_KEY=sk-...

هذا التحويل الوحيد هو سبب انتشار K2.7 السريع بين مستخدمي الوكلاء: تعمل منظومة Claude Code بأكملها دون تغيير على نموذج مفتوح الأوزان وبجزء بسيط من السعر.

التسعير

لكل مليون رمز عبر المنصة الرسمية:

الإدخال (تخطّي الذاكرة المؤقتة): 0.95 دولار
الإدخال (إصابة الذاكرة المؤقتة): 0.19 دولار
الإخراج: 4.00 دولار

تطابق الأسعار الأساسية K2.6، فالتوفير الحقيقي يأتي من تقليص رموز التفكير إضافة إلى التخزين المؤقت الفعّال للسياق — إصابة الذاكرة المؤقتة أرخص بخمسة أضعاف في الإدخال. في الحلقات الوكيلية التي تعيد إرسال موجّه نظام كبير وسياق قاعدة الكود في كل دورة، التخزين المؤقت ليس خياراً بل هو الفرق بين فاتورة معقولة وأخرى مهدِرة.

للاستخدام بسعر ثابت، تقدّم واجهة Kimi Code CLI باقات اشتراك تبدأ من نحو 19 دولاراً شهرياً وتصل إلى 199 دولاراً للاستخدام المتوازي الكثيف.

الاستضافة الذاتية لسيادة البيانات

رخصة MIT المعدّلة هي السبب الذي يجعل الفرق في منطقة الشرق الأوسط وشمال إفريقيا الخاضعة لقواعد حوكمة البيانات مثل INPDP (تونس) أو PDPL (السعودية) تولي هذا النموذج اهتماماً. الاستضافة الذاتية تعني ألا يغادر أي كود مصدري أو سياق خاص بنيتك التحتية.

المتطلّبات الواقعية:

المحرّكات الموصى بها: vLLM أو SGLang أو KTransformers
تكميم INT4 أصلي مدمج
الدقّة الكاملة نحو 600 غيغابايت على القرص؛ والإصدارات المكمّمة بقوة تقارب 240 غيغابايت
تحتاج إلى خادم متعدّد وحدات معالجة الرسوميات أو إزاحة كبيرة إلى الذاكرة العشوائية — هذا ليس نموذجاً لحاسوب محمول
لم يوجد بناء رسمي بصيغة GGUF أو Ollama أو llama.cpp عند الإطلاق، لذا خطّط حول vLLM أو SGLang

أبسط تشغيل عبر vLLM يبدو هكذا:

vllm serve moonshotai/Kimi-K2.7-Code \
  --tensor-parallel-size 8 \
  --max-model-len 262144 \
  --served-model-name kimi-k2.7-code

بمجرّد بدء الخدمة، يعمل عميل OpenAI نفسه أعلاه بتبديل base_url إلى نقطة وصولك الخاصة. كما أضافت Cloudflare Workers AI نموذج K2.7 Code عند الإطلاق إن أردت خدمة مُدارة دون امتلاك العتاد.

أين يصلح — وأين لا يصلح

K2.7 Code متخصّص. لا يوجد إصدار عام الأغراض أو إصدار Instruct عند الإطلاق؛ فهو مبني لتوليد الكود وتصحيح الأخطاء واستخدام الأدوات وسير العمل البرمجي متعدّد الخطوات. وإليك بعض الحدود الصادقة:

الاستدلال الإلزامي يعني أن حتى إصلاح سطر واحد يدفع ضريبة رموز التفكير. للتصنيف الرخيص عالي الحجم أو الدردشة البسيطة، يكون نموذج أصغر وأسرع خياراً أفضل.
سياق 256 ألف رمز يتأخّر عن نوافذ المليون رمز الشائعة الآن في النماذج المغلقة الرائدة. مع استرجاع جيّد يكفي لمعظم قواعد الكود الواقعية، لكنّ المستودعات العملاقة المُدخَلة كاملةً لن تتّسع.
اختبارات المورّد وحده تعني أن عليك إجراء تقييمك الخاص قبل إسناد سير عمل إنتاجي إليه.

أقوى حجّة هي تلك التي يصنعها السعر نيابة عنك: إن كان فريقك يعيش أصلاً في Claude Code أو Cline، فإن توجيه نقطة Anthropic إلى K2.7 Code وقياس فاتورة الرموز خلال أسبوع من العمل الحقيقي تجربة شبه معدومة المخاطر. وإن كان حِملك كثيف الأدوات وحسّاساً للتكلفة — ومعظم البرمجة الوكيلية كذلك — فإن تقليص 30٪ هو نوع الكفاءة الذي يظهر مباشرة في فاتورة الشهر التالي.

النمط الأوسع

يهبط K2.7 Code في يونيو 2026 حيث تتدفّق النماذج الصينية مفتوحة الأوزان — GLM-5.2 وMiniMax M3 والآن Kimi — بسرعة تكافح المختبرات المغلقة لمجاراتها. عدم التماثل، كما عبّر أحد المراقبين، "ليس في القدرة بل في السرعة." بالنسبة للمطوّرين، الخلاصة العملية هي رافعة: نموذج برمجة مفتوح الأوزان وقابل للاستضافة الذاتية ومتوافق مع Claude Code يزيل في خطوة واحدة كلاً من الاحتجاز التقني واعتراضات سيادة البيانات. اختبره بتشكّك، وخزّن مؤقتاً بقوّة، ودع سجلّات الرموز عندك تتّخذ القرار.

هل تبني سير عمل برمجة وكيلة أو تقيّم نماذج لغوية مستضافة ذاتياً لفريقك؟ تساعد نقطة شركات الشرق الأوسط وشمال إفريقيا على تبنّي بنية الذكاء الاصطناعي مع مراعاة سيادة البيانات والتكلفة.