الكتابات/blog/2026/06
Blog3 يونيو 2026·6 دقيقة

لماذا يفقد وكلاء الذكاء الاصطناعي تماسكهم في المهام الطويلة

يتخذ وكلاء الذكاء الاصطناعي قرارات صحيحة محليًا لكنهم يفشلون في المهمة ككل. تعرّف على فخاخ التماسك الخمسة وراء فشل الوكلاء في المهام الطويلة والأنماط التي تعالجها.

يمكن لوكيل الذكاء الاصطناعي أن يجيب عن كل سؤال على حدة إجابة صحيحة، ومع ذلك يخطئ في المهمة بأكملها. فهو يختار الأداة الصحيحة، ويكتب خطوة منطقية، ويتخذ قرارًا قابلًا للتبرير — وبعد أربعين خطوة يصبح المُخرَج لا يخدم نية أحد. هذه الفجوة بين الخطوات الصحيحة محليًا والنتيجة الصحيحة كليًا هي أكثر أسباب فشل الوكلاء في الإنتاج تجاهلًا. يسميها الباحثون انعدام التماسك الشامل (global incoherence)، وما إن تستطيع تسميتها حتى تبدأ في رؤيتها في كل مكان.

هذه ليست المشكلة نفسها التي تقول إن "مشاريع وكلاء الذكاء الاصطناعي تفشل بسبب تضخّم النطاق ورداءة البيانات". تلك قصة تنظيمية. أما هذه فقصة تقنية: حتى الوكيل المحدد النطاق تمامًا والمزوّد ببيانات نظيفة ينحرف عن مساره في المهام الطويلة. وفهم السبب هو الفرق بين عرض توضيحي مبهر ونظام يمكنك الوثوق به.

الحساب القاسي للعمل متعدد الخطوات

لنبدأ بالحساب لأنه يحدد حجم المخاطرة. لنفترض أن دقة الوكيل 95% في كل إجراء على حدة — وهي نسبة مثيرة للإعجاب فعلًا. اربط عشرة من هذه الإجراءات معًا وسينجح سير العمل بنسبة 60% فقط. اخفض الدقة لكل خطوة إلى 85% — وهي نسبة محترمة — وستنجح مهمة من عشر خطوات مرة واحدة تقريبًا من كل خمس محاولات.

التراكم لا يرحم. كلما طال الأفق، هيمن معدّل الخطأ الضئيل لكل خطوة على النتيجة النهائية. لهذا تنهار الوكلاء التي تبدو لامعة في العروض ذات الدور الواحد عند مواجهة سير عمل حقيقي يمتد عبر عشرات الاستدعاءات والاسترجاعات والقرارات. الفشل بنيوي، وليس دليلًا على نموذج ضعيف.

فخاخ التماسك الخمسة

انعدام التماسك الشامل ليس عيبًا واحدًا، بل عائلة من أنماط الفشل تشترك في بصمة واحدة: كل خطوة تبدو سليمة بمعزل عن غيرها. وخمسة منها تتكرر بما يكفي لتستحق أسماء.

1. الالتزام المبكر. يكافئ التقييم خطوة بخطوة ما يبدو أفضل الآن، فيتشبث الوكيل بخطة قبل أن تتوافر لديه معلومات كافية. يلتزم وكيل البحث باستعلام واحد، ثم يقضي بقية المهمة في الدفاع عنه بدل إعادة النظر فيه. تُضخَّم الخيارات قصيرة النظر المبكرة بمرور الوقت بدل تصحيحها.

2. الإبطال المتتالي. افتراض خاطئ واحد في الأعلى يُفسد بصمت كل ما يليه. لا يلاحظ الوكيل ذلك أبدًا، لأن كل خطوة لاحقة متسقة داخليًا مع المقدمة المعيبة. وعندما تظهر الأعراض، يكون السبب الجذري مدفونًا قبل عشرين خطوة.

3. العمى عن القيود. يُتجاهَل قيد حقيقي — سقف ميزانية، أو حد معدّل، أو قاعدة عمل — إلى أن يفوت أوان احترامه. يُحسّن الوكيل للمهمة التي يتخيلها بدلًا من القيود التي يعمل تحتها فعلًا.

4. فقدان ذاكرة السياق. تتسرب المعلومات التي جُمعت مبكرًا من السياق العامل. تتدهور جودة الاسترجاع في منتصف السياقات الطويلة (تأثير "الضياع في الوسط" الموثّق جيدًا)، فينسى الوكيل قرارًا اتخذه قبل عشرين خطوة ويناقض نفسه.

5. انحراف الهدف. تشوّه الانحرافات الاستدلالية المتراكمة الهدف الأصلي ببطء. لا توجد خطوة خاطئة بعينها، لكن الوجهة تتحرك بهدوء. ويقدّر أن الاختبارات المعيارية تستهين بمعدّل حدوث ذلك بنسبة 20 إلى 40 بالمئة، لأن مخرجات الوكيل تبقى سلسة ومعقولة طوال الطريق.

السمة الخطيرة التي تجمع الخمسة جميعًا أنها صامتة. لا استثناء، ولا أثر تتبّع، ولا خطأ أحمر. تتدهور الجودة بشكل غير مرئي، وهذا بالضبط سبب أهمية التقييم المنهجي أكثر من الاكتفاء بالشعور بأن الوكيل "يبدو" موثوقًا.

الاستدلال ليس التخطيط

يعود السبب الجذري إلى طريقة تدريب هذه النماذج. فهدف التنبؤ بالرمز التالي يحيّز النظام نحو إكمال النمط المحلي — إنهاء الفكرة الحالية بإتقان — بدلًا من التخطيط المنطقي الشامل عبر المهمة بأكملها. والانتباه الذاتي قوي لكنه محدود كذاكرة عاملة للاستدلال التسلسلي الطويل.

لهذا تفصل أكثر الوكلاء قدرة بين مهارتين تخلطهما الوكلاء الأضعف: الاستدلال (معرفة كيفية تنفيذ الخطوة الحالية) والتخطيط (معرفة أي تسلسل من الخطوات يبلغ الهدف وكيفية إصلاح الخطة عندما يخالفها الواقع). وما يميز الوكيل المرن ليس الذكاء الخام في كل خطوة، بل القدرة على التخطيط المسبق ومراقبة التقدّم والتكيّف عندما لا يتطابق العالم مع الخطة الأصلية.

أنماط تعيد التماسك

الخبر السار أن انعدام التماسك الشامل مشكلة معمارية، والمشكلات المعمارية لها حلول هندسية. ولا يتطلب أي من هذه الحلول نموذجًا أذكى — بل إطار عمل أفضل حول النموذج الذي بين يديك.

ثبّت الخطة الأولى. تعمل جودة الخطة المبكرة بمثابة "مرساة خطة" تمنع الأخطاء المتتالية. استثمر بشكل غير متناسب في إتقان الخطوة الأولى — فالتفكيك الصريح إلى رسم بياني موجّه من الأهداف الفرعية أفضل من ترك الوكيل يرتجل طريقه إلى الأمام.

فكّك واحتوِ. تقسّم الأساليب الهرمية مثل التخطيط المفصول للمهام العمل إلى شجرة أو رسم بياني لا دوري من الأهداف الفرعية، وتحصر التخطيط وإعادة التخطيط في العقدة النشطة. وعند فشل فرع ما، يبقى نطاق الضرر داخل ذلك الهدف الفرعي بدل تسميم المهمة كاملة.

أعد ذكر الهدف بوتيرة منتظمة. أدرج فترات لإعادة ذكر الهدف ليعيد الوكيل قراءة هدفه الفعلي كل بضع خطوات. واقرن ذلك بتلخيص هرمي كل عشر إلى عشرين خطوة يحتفظ بمنطق القرار والمهام المنجزة والقيود المفتوحة وحالة الهدف. هذا يواجه مباشرة فقدان ذاكرة السياق وانحراف الهدف.

أعد التخطيط في حلقة مغلقة. تنكسر الخطط الثابتة في البيئات غير الحتمية. ويحوّل التحقق من الخطة وإصلاحها أثناء التنفيذ — أي فحص بعد كل مرحلة ما إذا كانت الخطة لا تزال صالحة ومراجعتها إن لم تكن — السكربت الهشّ إلى عملية قابلة للتكيف.

تحقّق بالشيفرة، لا بالحدس. فضّل الفحوص الآلية المعتمدة على الشيفرة على ترك نموذج لغوي يصحّح واجبه بنفسه. تحقّق من المخرجات المهيكلة مقابل مخطط بيانات عند كل حدّ بين مخرج الوكيل والمستهلك التالي، حتى تُلتقط البيانات المهلوسة أو المشوّهة مبكرًا بدل أن تنتشر.

أضف قاطع دائرة. استعِر النمط ثلاثي الحالات من الأنظمة الموزعة. الحالة المغلقة تشغيل ذاتي طبيعي؛ والمفتوحة تصعيد إلى إنسان أو بديل عند تجاوز عتبات الخطأ أو التكلفة؛ ونصف المفتوحة اختبار حذر قبل الاستئناف. اجمعها مع حدود صارمة للتكرار وميزانية استدلال حتى لا تلتهم حلقة إعادة المحاولة آلاف الدولارات بصمت.

ضع البشر عند اللحظات الحاسمة. تنتمي نقاط تدقيق "الإنسان في الحلقة" إلى الإجراءات المكلفة العكس — المعاملات الخارجية، والكتابات غير القابلة للتراجع، والاتصالات الموجهة للعملاء — لا إلى فترات اعتباطية. صمّم نقاط التدقيق حسب حجم العواقب، لا حسب عدد الخطوات.

كيفية الطرح

تعامل مع المرونة كبرنامج مرحلي، لا كمفتاح تقلبه. قبل النشر، نفّذ تحليلًا لأنماط الفشل خاصًا بمهمتك وبياناتك وأدواتك. وفي الشهر الأول، ابنِ الأسس غير البرّاقة: قابلية المراقبة، وأسقف التكلفة، وقواطع الدوائر، والتحقق من المخطط، ومسارات تصعيد واضحة إلى الإنسان. ثم أخضع النظام لضغط في بيئة اختبار عدائية ضد كل فخّ من الفخاخ الخمسة. وبعد توافر الأدلة فقط ينبغي أن توسّع الاستقلالية تدريجيًا — متنقلًا من المراجعة البشرية الكاملة نحو الإشراف القائم على الاستثناءات كلما اكتسب الوكيل الثقة.

الخلاصة

تفشل الوكلاء في المهام الطويلة لا لأنها غبية في أي خطوة منفردة، بل لأن الصحة المحلية لا تتجمع وحدها لتصبح تماسكًا شاملًا. فالالتزام المبكر، والإبطال المتتالي، والعمى عن القيود، وفقدان ذاكرة السياق، وانحراف الهدف كلها أعراض للفجوة المعمارية نفسها بين الاستدلال والتخطيط. أغلق هذه الفجوة بخطط مثبّتة، وتفكيك محتوى، وإعادة ذكر دورية للهدف، وإعادة تخطيط في حلقة مغلقة، وتحقق بالشيفرة، وقواطع دوائر، ونقاط تدقيق بشرية موضوعة بعناية — تحوّل عرضًا مبهرًا لكنه هشّ إلى نظام يحافظ على شكله عبر المهمة بأكملها.

في نقطة، نبني وكلاء الذكاء الاصطناعي والأتمتة للشركات في تونس ومنطقة الشرق الأوسط وشمال أفريقيا بهذا الانضباط بالضبط: ليس أكثر العروض بريقًا، بل سير العمل الذي لا يزال يعمل عند الخطوة الأربعين. إن أردت وكلاء يمكنك الوثوق بهم فعلًا في الإنتاج، لنتحدث.