في العشرين من ماي 2026، أطلقت شركة كوهير نموذجها الأقوى حتى الآن: Command A+. الإطلاق ليس مجرد تحديث تقني، بل أوّل نموذج تنشره الشركة بترخيص Apache 2.0 الكامل المفتوح. بالنسبة لفرق التطوير في منطقة الشرق الأوسط وشمال أفريقيا التي تحتاج ذكاءً اصطناعياً متقدّماً دون إرسال بياناتها إلى مزوّدي السحابة الكبار، هذا هو الإصدار الأهم في الربع الحالي. في هذا الدليل نستعرض المعمارية، والمعايير، وكيفية تشغيل النموذج فعلياً.
ما هو Command A+ تقنياً
النموذج عبارة عن معماريّة خليط من الخبراء (Mixture of Experts) متفرّقة بطراز Decoder، تحوي 218 مليار معامل إجمالي و25 مليار معامل نشط لكل رمز. يستخدم 128 خبيراً، يتم تنشيط 8 منهم لكل رمز، إضافة إلى خبير مشترك واحد يُطبَّق على كل الرموز. الخيار التصميمي مدروس: نموذج كثيف بهذا الحجم سيكون مكلفاً جداً للنشر، لكن توجيه MoE يحافظ على كثافة الاستدلال مع سعة معاملات كبيرة.
أهم الأرقام التي تستحق الحفظ:
- سياق إدخال 128 ألف رمز، وحدّ توليد 64 ألف رمز
- 48 لغة مدعومة، مقارنة بـ23 في الجيل السابق
- تكميم W4A4 يعمل على بطاقتي H100 أو بطاقة B200 واحدة
- ترخيص Apache 2.0 يسمح بالاستخدام التجاري والتعديل وإعادة التوزيع
- دعم vLLM من اليوم الأول للتشغيل على نطاق واسع
تضع كوهير النموذج تحت شعار "الذكاء الاصطناعي السيادي": القدرة على تشغيل نماذج متقدّمة داخل بنية تحتية تحت سيطرة الحكومات والبنوك وشركات الاتصالات والمؤسسات الخاضعة للتنظيم. الترخيص والبصمة العتادية الصغيرة يحوّلان هذا الوعد إلى واقع قابل للتنفيذ.
صورة المعايير
نشرت كوهير قفزات واضحة على عدّة أعباء عمل مقارنة بالجيل السابق:
| المعيار | Command A+ | Command A السابق |
|---|---|---|
| Terminal-Bench Hard (برمجة وكلاء) | 25٪ | 3٪ |
| τ²-Bench (استدلال اتصالات) | 85٪ | 37٪ |
| MMMU (متعدد الوسائط) | 75.1٪ | — |
| MMMU Pro | 63٪ | — |
| MathVista (استدلال رياضي) | 80.6٪ | — |
كما حقّق النموذج 37 نقطة في مؤشر Artificial Analysis Intelligence Index، ما يضعه في نفس فئة كبار النماذج المغلقة لمعظم المهام المؤسسية.
التحفّظ الصادق: لاحظ مراقبون مستقلّون يوم الإطلاق أن Command A+ لا يتفوّق على Qwen 3.6 في كل المعايير المتداخلة، رغم أنه يُنشّط ثمانية أضعاف عدد المعاملات لكل رمز. الحكاية هنا ليست التفوّق العاري على لوحات النتائج، بل مزيج الترخيص المتساهل، والدعم متعدّد اللغات الأصلي، والاستشهادات المضمّنة، والبصمة الصغيرة للنشر في حزمة واحدة.
لماذا تهمّ القصّة العربية ومتعدّدة اللغات
هذا هو الجزء الذي ستُقصّر معظم التغطية في إبرازه. تُبلغ كوهير عن تحسينات في كفاءة التقطيع (Tokenization) قدرها 20٪ للعربية، و16٪ للكورية، و18٪ لليابانية. الترجمة العملية: نفس الفقرة العربية تستهلك خُمساً أقل من الرموز مقارنة بالجيل السابق، ما يخفّض مباشرة تكلفة الاستدلال والكمون لأعباء العمل العربية.
بالنسبة لشركة تكنولوجيا مالية تونسية، أو بوابة حكومية سعودية، أو فريق قانوني إماراتي، يتراكم هذا المكسب عبر ملايين الطلبات. مع النشر داخل المنشأة، يتوفّر جواب مقنع عن سؤالين متكرّرين من مديري المعلومات في المنطقة:
- هل يمكننا إبقاء المحتوى العربي الخاضع للتنظيم داخل مركز بياناتنا؟ نعم.
- هل سيبقى الاستدلال بالعربية مجدياً اقتصادياً على نطاق واسع؟ نعم، وأفضل من قبل.
كيفية البدء
النموذج متاح بثلاث طرق:
1. أوزان مفتوحة على Hugging Face. اسحب CohereLabs/command-a-plus-05-2026-w4a4 للإصدار المُكمَّم، أو BF16/FP8 لدقّة أعلى. ترخيص Apache 2.0 يعني عدم وجود إجراءات ترخيص إضافية.
2. استدلال مُدار عبر Cohere Model Vault. إذا أردت النموذج دون عبء تشغيله.
3. واجهة Cohere API. اتصل بنقطة نهاية المحادثة بمعرّف النموذج الجديد command-a-plus-05-2026.
أمر تشغيل بسيط بـ vLLM للنسخة W4A4:
vllm serve CohereLabs/command-a-plus-05-2026-w4a4 \
--tensor-parallel-size 2 \
--max-model-len 131072 \
--quantization compressed-tensors \
--enable-auto-tool-choice \
--tool-call-parser cohereونداء Python بعد تشغيل الخادم:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:8000/v1",
api_key="EMPTY",
)
response = client.chat.completions.create(
model="CohereLabs/command-a-plus-05-2026-w4a4",
messages=[
{"role": "system", "content": "أجب مع الاستشهاد بالمصادر المُعطاة."},
{"role": "user", "content": "لخّص تعديلات نظام حماية البيانات الشخصية 2026 في جملتين."},
],
temperature=0.3,
)
print(response.choices[0].message.content)النموذج متوافق مع واجهة OpenAI API عبر vLLM، فمعظم كود العميل القائم يعمل دون تغيير.
الاستشهادات الأصلية وتوليد RAG
يأتي Command A+ بوضع استشهادات منظّم يُصدر امتدادات المصدر إلى جانب النص المُولَّد. لخطوط أنابيب التوليد المعزّز بالاسترجاع التي تحتاج إظهار مصدر الإجابة للمستخدم — كقواعد المعرفة الداخلية، والبحث القانوني، وأسئلة الامتثال — هذا يُزيل طبقة من هندسة المطالبات الهشّة التي تصونها معظم الفرق يدوياً.
النمط مباشر: مرّر القطع المسترجعة كجزء من الإدخال، ويُعيد النموذج الإجابة مع مراجع داخلية لمعرّفات القطع التي استخدمها فعلياً. تصبح سجلّات التدقيق ناتجاً من الدرجة الأولى لا فكرة مؤخّرة.
متى تختار Command A+
هو الخيار الصحيح حين تحتاج:
- نشر داخل المنشأة أو داخل VPC فقط لأسباب تنظيمية
- استدلال قوي بالعربية أو اليابانية أو الكورية دون ضريبة الرموز
- استشهادات أصلية في أنظمة RAG حيث نسب المصدر غير قابل للتفاوض
- حرّية ترخيص Apache 2.0 للتفريع والضبط الدقيق وإعادة التوزيع
ليس الخيار الأمثل إذا كان الفوز الخام على معايير البرمجة أو الاستدلال هو المعيار الوحيد — Qwen 3.6، وDeepSeek، والنماذج المغلقة من OpenAI وAnthropic وGoogle لا تزال تتبادل الضربات على لوحات نتائج فردية. اختر الأداة التي تناسب القيد الذي يقيّدك فعلاً.
ما يعنيه ذلك لفرق التقنية في الشرق الأوسط وشمال أفريقيا
ثلاث خلاصات للفرق التي تُطلق منتجاتها في تونس ودول الخليج والمنطقة الأوسع:
- الذكاء الاصطناعي السيادي صار قابلاً للبناء، لا مجرّد طموح. بطاقتا H100 في مركز بيانات بتونس ميزانية ممكنة. وكذلك الوضوح القانوني لترخيص Apache 2.0.
- المنتجات الناطقة بالعربية أصبحت أرخص بين ليلة وضحاها. مكسب 20٪ في كفاءة الرموز هو رافعة اقتصادية حقيقية.
- استراتيجية كوهير تتمايز بالنشر، لا بالمعايير. هذه إشارة مفيدة لكيفية تموضع منتجاتك في الذكاء الاصطناعي: في الأسواق المنظَّمة، يتفوّق وضع النشر على رتبة لوحة النتائج.
إذا كنت تُقيّم بنية تحتية لنماذج لغوية لعبء عمل خاضع للتنظيم في المنطقة، يستحق Command A+ مكاناً في القائمة المختصرة إلى جانب أي نموذج مغلق تستخدمه حالياً. السؤال المثير ليس ما إذا كان يفوز بكل المعايير، بل ما إذا كان يُزيل قيوداً — قانونية أو جغرافية أو اقتصادية — لا تزال منظومتك الحالية تفرضها.
تودّ مناقشة نشر نموذج لغوي لفريقك؟ تواصل معنا — نساعد المؤسسات في منطقة الشرق الأوسط وشمال أفريقيا على تقييم ونشر الذكاء الاصطناعي المؤسسي.