الكتابات/blog/2026/06
Blog17 يونيو 2026·6 دقيقة

GLM-5.2: ذكاء برمجي متطور مفتوح المصدر بخُمس التكلفة

نموذج GLM-5.2 من Zhipu مفتوح برخصة MIT بحجم 744 مليار معامل و سياق مليون رمز، ينافس Claude Opus في البرمجة بنحو خُمس تكلفة الـ API.

في 13 يونيو 2026، أطلقت شركة Zhipu AI (المعروفة بـ Z.ai) ومقرها بكين نموذج GLM-5.2 — وخلال أيام تصدّر لوحات تصنيف البرمجة العامة. الأوزان المفتوحة، التي صدرت برخصة MIT في الأسبوع التالي على Hugging Face و ModelScope، حققت ما ظل مجتمع المصادر المفتوحة يَعِد به منذ عامين: وضعُ نموذج بقدرات برمجة وكيلية في مستوى الصف الأول بين يدي أي مطوّر، دون احتكار مورّد ودون سقف لكل رمز يمكن أن يُلغى بين ليلة وضحاها بقرار سياسي.

ولم يكن التوقيت عابراً. فقد جاء إعلان فتح المصدر في الأسبوع نفسه الذي أجبرت فيه قيود التصدير الأمريكية أحد المختبرات الأمريكية الكبرى على قطع الوصول العالمي إلى أكثر نماذجه تقدماً. وكان موقف Zhipu واضحاً: "الذكاء المتطور يجب ألا يكون حكراً على قلة، ولا أن يُسحب في أي لحظة بقواعد قليلة. يجب أن يكون مفتوحاً، قابلاً للاستخدام والبناء، وأن يخدم كل مطوّر."

ما هو GLM-5.2 فعلياً

GLM-5.2 نموذج مزيج خبراء (MoE) بحجم 744 مليار معامل، يُفعّل نحو 40 مليار معامل لكل رمز. مقارنةً بسابقه GLM-5.1، فإن أبرز الترقيات هي قفزة بخمسة أضعاف في السياق — من نحو 200 ألف إلى مليون رمز كامل — وتركيز أحدّ على البرمجة الوكيلية طويلة الأمد.

المواصفةGLM-5.2
البنية744B MoE، ~40B نشطة لكل رمز
نافذة السياق1,000,000 رمز
أقصى مخرجات131,072 رمز
جهد الاستدلالHigh (أسرع) / Max (أعمق)
الرخصةMIT (أوزان مفتوحة)
البرمجة الذاتيةاستدعاء أدوات متعدد الخطوات، تشغيل حتى ~8 ساعات

يُحدث وضعا الاستدلال فرقاً في أعباء العمل الحقيقية. يبقي وضع High زمن الاستجابة والإنفاق منخفضين للإكمالات اليومية؛ بينما يُنفق وضع Max بسخاء — يفيد المختبرون الأوائل بنحو 85 ألف رمز مخرجات لمهمة واحدة صعبة — لاجتياز حلقات البرمجة المعقدة متعددة الخطوات. تختار الوضع لكل طلب، فلا تدفع أسعار الاستدلال العميق مقابل الإكمال التلقائي.

قصة المعايير (والتحفظات)

أصدرت Zhipu النموذج بجداول معايير محدودة من الطرف الأول، لذا تعامل مع الأرقام البارزة باعتبارها مزيجاً من ادعاءات المورّد واختبارات المجتمع المبكرة. ومع ذلك فالإشارات متّسقة:

المعيارGLM-5.2السياق
Terminal-Bench 2.181.0ارتفاعاً من 63.5 لـ GLM-5.1 — مهام CLI وكيلية
SWE-bench Pro62.1%هندسة برمجيات واقعية
Code Arena (واجهات أمامية)المركز 1–2يتقدم على Claude Opus 4.7 و 4.8 (Thinking) وفق التقارير
Design Arenaالمركز 1 (Elo ~1360)جودة تصميم الكود/الواجهة
FrontierSWEفي حدود ~1% من Claude Opus 4.8يتفوق على GPT-5.5 وفق المورّد

الخلاصة الأكثر تكراراً في المجتمع: مع تقييد إتاحة بعض النماذج المغلقة المتطورة، يُعد GLM-5.2 على الأرجح أفضل نموذج متاح بشكل مفتوح للبرمجة الأمامية والوكيلية حالياً. ويلاحظ عدة مطورين أنه يتعامل مع ضغط السياق داخل أُطر وكلاء البرمجة بشكل أفضل بوضوح من GLM-5.1 — مكسب عملي للجلسات الطويلة. وكالعادة، تحقق من أعباء عملك الخاصة قبل بناء بنيتك التحتية على نتيجة لوحة تصنيف.

البداية: واجهة برمجية متوافقة مع OpenAI

يوفر GLM-5.2 نقطة وصول متوافقة مع OpenAI عبر منصة BigModel / Z.ai، لذا فإن ترحيل تكامل قائم يقتصر غالباً على تغيير عنوان القاعدة واسم النموذج.

from openai import OpenAI
 
client = OpenAI(
    api_key="YOUR_ZAI_API_KEY",
    base_url="https://api.z.ai/api/paas/v4",
)
 
response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "أنت مهندس واجهة خلفية خبير."},
        {"role": "user", "content": "أعد هيكلة مسار Express هذا لاستخدام معالجة الأخطاء غير المتزامنة."},
    ],
    extra_body={"thinking": {"type": "enabled"}},  # وضع استدلال أعمق
)
 
print(response.choices[0].message.content)

للحصول على متغير السياق الكامل بمليون رمز، اطلب معرّف النموذج طويل السياق (يظهر غالباً باسم glm-5.2[1m] على بوابات التجميع). وتبدو حلقة وكيلية نموذجية مع استدعاء الأدوات مألوفة لكل من سبق له ربط استدعاء الدوال:

tools = [{
    "type": "function",
    "function": {
        "name": "run_tests",
        "description": "تشغيل مجموعة اختبارات المشروع وإرجاع الإخفاقات",
        "parameters": {
            "type": "object",
            "properties": {"path": {"type": "string"}},
            "required": ["path"],
        },
    },
}]
 
response = client.chat.completions.create(
    model="glm-5.2",
    messages=messages,
    tools=tools,
    tool_choice="auto",
)

ولأن واجهة الـ API تحاكي OpenAI، يندمج GLM-5.2 في الأُطر القائمة — وكلاء البرمجة، وبوابات نماذج اللغة، وأنظمة التوجيه متعددة النماذج — بأقل قدر من الكود الرابط. اقرنه بموجّه وسترسل الإكمالات الروتينية إلى GLM-5.2 بينما تحتفظ بنموذج من الطبقة العليا للقرارات الصعبة فعلاً.

الاقتصاد: لماذا يغيّر هذا الحسابات

يدور سعر الـ API لنموذج GLM-5.2 حول 1.4 دولار لكل مليون رمز إدخال و 4.4 دولار لكل مليون رمز إخراج — أي نحو خُمس تكلفة النماذج المغلقة المتطورة المماثلة. وهناك مسار اشتراك أيضاً: تبدأ خطة GLM Coding من نحو 18 دولاراً شهرياً، وتشحن Zhipu أداة ZCode 3.0 البرمجية المبنية على نواة وكيل خاصة إلى جانب النموذج.

في أعباء العمل الوكيلية تتراكم فجوة التكلفة. فالوكلاء يستهلكون كميات هائلة من الرموز — سياقات طويلة، استدعاءات أدوات متكررة، إعادة محاولات، وتصحيح ذاتي. والاستراتيجية الواقعية ذات طبقتين:

  • اجعل GLM-5.2 الافتراضي للإكمالات والقوالب وإعادة الهيكلة والخطوات الوكيلية الروتينية.
  • صعّد إلى نموذج من الطبقة العليا فقط للقرارات القليلة التي يكون الخطأ فيها مكلفاً.

هذا يبقي الجودة عالية في القرارات الصعبة بينما يقلّص الجزء الأكبر من فاتورة الرموز، والأوزان المفتوحة تعني أنك تستطيع استضافة النموذج نفسه ذاتياً إن تطلبت إقامة البيانات ذلك.

مراجعة واقعية للاستضافة الذاتية

تعني رخصة MIT أنك تستطيع تشغيل GLM-5.2 على أجهزتك الخاصة — لكن كن صريحاً بشأن البصمة. فعلى عكس بعض نظرائه، لا يضغط GLM-5.2 ذاكرة KV المؤقتة، والأوزان بصيغة BF16. تقدّر قياسات المجتمع أوزان الدقة الكاملة بنحو 1.4 تيرابايت، مع إضافة تسلسل واحد بمليون رمز نحو 92 جيجابايت من الذاكرة الإضافية للذاكرة المؤقتة وحدها. هذا نشر بمستوى مركز بيانات لا حاسوب محمول.

لمعظم الفرق، المسار العملي هو: النمذجة الأولية مقابل الـ API المُستضاف، واللجوء إلى الاستضافة الذاتية (أو نسخة مجتمعية مكمّمة) فقط عندما تبرر السيادة أو الامتثال أو اقتصاديات الحجم بصمة وحدات المعالجة الرسومية. وستضيّق النسخ المكمّمة والمقطّرة هذه الفجوة خلال الأشهر المقبلة.

زاوية السيادة لفرق منطقة الشرق الأوسط وشمال إفريقيا

تجعل حقيقتان من GLM-5.2 ذا أهمية استراتيجية للفرق عبر تونس والسعودية ومنطقة الشرق الأوسط وشمال إفريقيا الأوسع.

أولاً، جرى التدريب بالكامل على عتاد Huawei Ascend باستخدام إطار MindSpore — دون أي اعتماد على NVIDIA في خط الإنتاج، مع استدلال من اليوم صفر عبر ثماني منصات شرائح محلية. وهذا يعزل النموذج عن اضطرابات ضوابط التصدير التي قد تقطع فجأة الوصول إلى النماذج المتطورة المستضافة أمريكياً.

ثانياً، الأوزان المفتوحة مع رخصة MIT تساوي سيادة بيانات حقيقية. فالمؤسسة الملزمة بإبقاء الكود والمطالبات داخل حدودها تستطيع تشغيل GLM-5.2 محلياً دون فاتورة لكل رمز، ودون مغادرة بيانات الاستخدام للمبنى، ودون خطر سحب النموذج من تحت منتج حي بسبب تغيير في سياسة مورّد. للقطاعات المنظمة — المالية والحكومية والصحية — يصبح هذا المزيج عاملاً حاسماً متزايداً، لا مجرد نقطة معيار أو اثنتين.

الخلاصة

GLM-5.2 هو أوضح إشارة حتى الآن إلى أن الفجوة بين الأوزان المفتوحة والنماذج المغلقة المتطورة قد كادت تُغلق في أعمال البرمجة والوكلاء. ليس مثالياً — فذاكرة KV غير المضغوطة تثقل النشر المحلي، وشفافية المعايير المنشورة ضعيفة — لكن الجمع بين برمجة من الصف الأول، وسياق مليون رمز قابل للاستخدام، ورخصة MIT، ونحو خُمس التكلفة، أمرٌ يصعب الجدال معه. للمطورين، الخطوة بسيطة: اربطه في حزمتك المتوافقة مع OpenAI كطبقة افتراضية، واحتفظ بنموذج متميز في الانتظار للمسائل الصعبة، ودع الاقتصاد يفعل الباقي.

تبني منتجاً مدعوماً بالذكاء الاصطناعي وتوازن بين النماذج مفتوحة الأوزان والـ API المغلقة؟ تساعد نقطة فرق المنطقة على تصميم بنى ذكاء اصطناعي فعّالة التكلفة وواعية بالسيادة — من توجيه النماذج إلى النشر الذاتي.