وكلاء الذكاء الاصطناعي ذاتيو التحسين الذين يتعلمون من التجربة

وكلاء الذكاء الاصطناعي ذاتيو التحسين يتعلمون من التجربة ويبنون مهارات مستقلة

معظم وكلاء الذكاء الاصطناعي اليوم يتبعون نصًا ثابتًا. تُرسل لهم أمرًا، يستجيبون، ثم يُعاد تعيين كل شيء. لكن جيلاً جديدًا من الوكلاء يكسر هذا النمط — وكلاء يتذكرون ما نجح، يتجاهلون ما فشل، ويصبحون أفضل بشكل قابل للقياس في عملهم بمرور الوقت.

هذا هو التحول من المساعدين الثابتين إلى الوكلاء ذاتيي التحسين، وهو أحد أهم الاتجاهات في هندسة الذكاء الاصطناعي في 2026.

ما الذي يجعل الوكيل ذاتي التحسين؟

يعمل الوكيل ذاتي التحسين على حلقة تغذية راجعة مغلقة. بعد إتمام مهمة، يُقيّم النتيجة، يسجل دروسًا منظمة، ويستخدم تلك الدروس للأداء بشكل أفضل في المرة القادمة. المكونات الأساسية هي:

الذاكرة الحلقية — سجل منظم لما جربه الوكيل، ما نجح، وما فشل
اكتساب المهارات — القدرة على إنشاء إجراءات قابلة لإعادة الاستخدام من المهام المعقدة
التفكير الفوقي — تحسين ليس فقط أداء المهمة، بل عملية التحسين ذاتها
الاستمرارية — الاحتفاظ بالمعرفة عبر الجلسات، وليس فقط ضمن محادثة واحدة

هذا يختلف جذريًا عن الضبط الدقيق أو RLHF. الوكيل يتحسن أثناء التشغيل، خلال العمل الفعلي، دون إعادة تدريب النموذج الأساسي.

Hermes Agent: الرائد مفتوح المصدر

Hermes Agent من NousResearch، الذي أُطلق في فبراير 2026 بترخيص MIT، هو التطبيق الأبرز لهذا النمط. مع أكثر من 8,700 نجمة على GitHub و142 مساهمًا، أصبح البنية المرجعية للوكلاء ذاتيي التحسين.

كيف يتعلم Hermes

بعد إتمام المهام المعقدة (عادةً تلك التي تتطلب خمس استدعاءات أدوات أو أكثر)، يُنشئ Hermes تلقائيًا "مهارات" منظمة بصيغة Markdown — وثائق تحتوي على إجراءات خطوة بخطوة، أخطاء شائعة، وخطوات التحقق. هذه المهارات ليست ثابتة. عندما يواجه الوكيل مهمة مشابهة ويكتشف نهجًا أفضل، يُحدّث المهارة تلقائيًا.

نظام الذاكرة مُصمم ليكون مدمجًا عمدًا:

MEMORY.md — حوالي 2,200 حرف لحقائق البيئة والدروس المستفادة
USER.md — حوالي 1,375 حرفًا لتفضيلات المستخدم وأسلوب التواصل
بحث نصي كامل عبر SQLite — لاسترجاع السياق من جلسات سابقة بعد أسابيع

يعمل في أي مكان، مع أي نموذج

يعمل Hermes على خادم VPS بتكلفة 5 دولارات شهريًا. يدعم Telegram وDiscord وSlack وWhatsApp وSignal وسطر الأوامر من بوابة واحدة. يمكنك ربطه بـ OpenRouter (أكثر من 200 نموذج) أو OpenAI أو Anthropic أو Ollama أو نقطة نهاية خاصة بك.

التحديث الأخير v0.5.0 قدّم الذاكرة عبر المنصات — ما يتعلمه وكيل واحد، يعرفه كل وكيل آخر. والميزة الأحدث تسمح للوكلاء بتدريب نسخ أرخص من أنفسهم من سجل عملهم.

OpenSpace: الذكاء الجماعي للمهارات

بينما يركز Hermes على تحسين الوكيل الفردي، يتعامل OpenSpace من HKUDS مع الذكاء الجماعي. إنه محرك مهارات ذاتي التطور حيث تلتقط الوكلاء أنماط المهام وتشاركها عبر مجتمع.

يعمل OpenSpace في ثلاثة أوضاع:

FIX — مهارات مكتوبة يدويًا لإجراءات معروفة
DERIVED — مهارات مُركّبة من إتمامات المهام الناجحة
CAPTURED — أنماط مُستخرجة تلقائيًا من سلوك الوكيل

في الاختبارات، حقق OpenSpace تخفيضًا بنسبة 46% في استخدام التوكنات وتحسنًا بمقدار 4.2 ضعف في المهام المهنية الواقعية.

DGM-Hyperagents: الكود ذاتي التعديل

يأتي النهج الأكثر جرأة من إطار عمل DGM-Hyperagent، المستوحى من آلات غودل. هذه الوكلاء لا تتعلم مهارات جديدة فحسب — بل تُعدّل عمليات التفكير الخاصة بها.

يدمج DGM-Hyperagent تنفيذ المهام والتفكير الفوقي في برنامج واحد قابل للتحرير. يمكن للوكيل تصحيح منطق اتخاذ القرار الخاص به عند تحديد إخفاقات منهجية. عبر مجالات متنوعة — البرمجة، مراجعة الأبحاث، تصميم مكافآت الروبوتات، والرياضيات على مستوى الأولمبياد — أظهرت هذه الوكلاء تحسنًا مستمرًا يتفوق على المقاييس الثابتة.

الابتكار الرئيسي هو أن التحسينات الفوقية تنتقل عبر المجالات. تحسين مُكتشف أثناء حل مسائل رياضية يمكن أن يُحسّن نهج الوكيل في مراجعة الكود.

الركائز الأربع للتطور الذاتي

كل مشروع ناجح للوكلاء ذاتيي التحسين يشترك في أربعة مبادئ أساسية:

التغذية الراجعة المغلقة — تقييم تلقائي للنتائج، وليس مجرد التنفيذ
اكتساب المهارات الذرية — تقسيم النُهج الناجحة إلى وحدات قابلة لإعادة الاستخدام والتركيب
استمرارية التجربة — المعرفة تبقى بعد انتهاء الجلسة الحالية
التفكير الفوقي التراجعي — عملية التحسين ذاتها تتحسن بمرور الوقت

AutoResearch: وكلاء يُجرون تجاربهم الخاصة

يُظهر مشروع AutoResearch من أندريه كارباثي الشكل الأقصى للتحسين الذاتي: وكلاء تصمم التجارب، تعدّل كود التدريب، تجمع البيانات، وتُحسّن المعلمات الفائقة — كل ذلك دون تدخل بشري.

في تشغيل واحد، نفّذ AutoResearch 700 تجربة في يومين واكتشف 20 تحسينًا أدى فعليًا إلى تحسين تدريب النموذج.

التأثيرات العملية للفرق

الوكلاء ذاتيو التحسين يُغيّرون اقتصاديات نشر الذكاء الاصطناعي:

تكلفة هامشية متناقصة — الوكيل يصبح أرخص في التشغيل كلما جمع مهارات وقلّل استخدام التوكنات
الذاكرة المؤسسية — معرفة الفريق تبقى في مهارات الوكيل بدلاً من أن تختفي عند مغادرة الأشخاص
عوائد متراكمة — على عكس الأدوات الثابتة، الوكلاء ذاتيو التحسين يقدمون قيمة أكبر كلما طالت مدة استخدامهم
تقليل هندسة الأوامر — الوكيل يتعلم تفضيلاتك واتفاقياتك بدلاً من الحاجة لتعليمات مفصلة في كل مرة

بالنسبة للشركات الناشئة والمؤسسات الصغيرة في منطقة الشرق الأوسط وشمال أفريقيا، هذا ذو أهمية خاصة. وكيل ذاتي التحسين على خادم بـ 5 دولارات يمكنه تراكم أشهر من المعرفة التشغيلية، ليصبح فعليًا عضوًا متخصصًا في الفريق لا ينسى ولا يتوقف عن التحسين.

المخاطر التي يجب مراقبتها

التحسين الذاتي لا يخلو من التحديات:

انحراف المهارات — بدون حواجز حماية، قد يُحسّن الوكلاء للأهداف الخاطئة
تراكم الأخطاء — درس خاطئ مُتعلَّم مبكرًا يمكن أن ينتشر عبر القرارات المستقبلية
قابلية التدقيق — مع تعديل الوكلاء لسلوكهم، يصبح تتبع سبب قرار معين أصعب
الأمان — الأنظمة ذاتية التعديل توسّع سطح الهجوم إذا تم اختراق سجلات المهارات

ما الذي سيأتي بعد ذلك؟

المسار واضح. وكلاء الذكاء الاصطناعي في 2026 ينتقلون من أدوات تُعدّها أنت إلى أنظمة تُعدّ نفسها بنفسها. الفائزون في منظومة الوكلاء — سواء كان Hermes أو OpenSpace أو شيء لم يُبنَ بعد — سيتحددون بمن يقدم أفضل نظام ذاكرة وتعلم.

السؤال لم يعد "هل يستطيع هذا الوكيل أداء المهمة؟" بل أصبح "هل يستطيع هذا الوكيل تعلم أداء المهمة بشكل أفضل غدًا مما يفعله اليوم؟"

الوكلاء الذين يجيبون بنعم هم الذين يستحقون النشر.