ويكي LLM من كارباثي: ما بعد RAG
مشكلة RAG الأساسية
تجربة معظم الناس مع نماذج اللغة الكبيرة والمستندات تتبع النمط نفسه: ترفع ملفات، تطرح سؤالاً، يتم استرجاع أجزاء من النص، وتحصل على إجابة. هذا هو التوليد المعزز بالاسترجاع (RAG)، وهو يعمل — لكنه يعاني من خلل جوهري.
RAG يعيد اكتشاف المعرفة من الصفر مع كل سؤال. لا يوجد تراكم، ولا تجميع، ولا تطور. كل استعلام يبدأ من نقطة الصفر. النظام لا يصبح أذكى أبداً.
أندريه كارباثي، المؤسس المشارك لـ OpenAI والمدير السابق للذكاء الاصطناعي في تسلا، شارك مؤخراً نهجاً مختلفاً أحدث ضجة كبيرة في مجتمع الذكاء الاصطناعي — أكثر من 5,000 نجمة على GitHub في 48 ساعة فقط.
ما هو نمط ويكي LLM؟
ويكي LLM هو نمط لا يكتفي فيه نموذج اللغة الكبير باسترجاع المعلومات — بل يقوم بصيانة قاعدة معرفة منظمة ومترابطة بشكل فعّال. تخيل أنك وظّفت أمين مكتبة لا ينفد صبره أبداً، يقرأ كل مستند تعطيه إياه، يحدّث كل صفحة ذات صلة في الويكي، ولا ينسى أبداً إضافة المراجع التبادلية.
الفكرة الجوهرية بسيطة: البشر ينتقون ويستكشفون؛ نماذج اللغة تتولى العمل الممل.
بدلاً من تضمينات المتجهات والبحث بالتشابه، يستخدم الويكي ملفات Markdown عادية منظمة في ملخصات وصفحات كيانات ومقالات مفاهيم ومقارنات. كل ادعاء يمكن تتبعه إلى ملف مصدر محدد يستطيع الإنسان قراءته أو تعديله أو حذفه.
البنية ثلاثية الطبقات
بنية كارباثي مبنية على ثلاث طبقات متمايزة:
الطبقة الأولى: المصادر الخام (غير قابلة للتعديل)
مجموعتك المنتقاة من المستندات الأصلية — مقالات، أوراق بحثية، نصوص محادثات، ملاحظات، صور. النموذج يقرأ من هذه الطبقة لكنه لا يعدلها أبداً. هذا يحافظ على مصدر الحقيقة.
الطبقة الثانية: الويكي (مولّد بواسطة LLM)
ملفات Markdown يملكها النموذج بالكامل. يُنشئ الصفحات، يحدّثها عند وصول مصادر جديدة، يحافظ على المراجع التبادلية، ويضمن الاتساق عبر قاعدة المعرفة بأكملها. البشر يقرأون؛ النماذج تكتب.
الطبقة الثالثة: المخطط
مستندات الإعداد (مثل ملف CLAUDE.md) التي تحدد بنية الويكي والاتفاقيات وسير العمل. هذه الطبقة تحوّل النموذج من روبوت محادثة عام إلى مشرف معرفة منضبط.
العمليات الأساسية
يدعم النظام ثلاث عمليات جوهرية:
الاستيعاب (Ingest)
عندما تضيف مصدراً جديداً، يقرأه النموذج ويناقش النقاط الرئيسية ويكتب ملخصات ويحدّث الفهرس ويراجع صفحات الكيانات والمفاهيم ويضيف سجلات التغييرات. مصدر واحد يمكن أن يؤثر على 10 إلى 15 صفحة في الويكي في وقت واحد.
الاستعلام (Query)
اطرح أسئلة على الويكي. يبحث النموذج في الصفحات ذات الصلة عبر الفهرس، يجمّع الإجابات مع الاستشهادات، و — هنا الفرق الجوهري — يحفظ النتائج القيّمة في الويكي كصفحات جديدة. استكشافاتك تتراكم في قاعدة المعرفة بدلاً من أن تختفي في تاريخ المحادثات.
التدقيق (Lint)
فحوصات صحية دورية تحدد التناقضات بين الصفحات، والادعاءات القديمة التي تجاوزتها مصادر أحدث، والصفحات اليتيمة بدون روابط واردة، وفجوات البيانات التي تحتاج اهتماماً.
ويكي LLM مقابل RAG التقليدي
| الجانب | RAG | ويكي LLM |
|---|---|---|
| استمرارية المعرفة | تُعاد مع كل استعلام | تُجمّع مرة وتبقى محدّثة |
| البنية | أجزاء مسطحة في مخزن متجهات | ويكي منظم بمراجع تبادلية |
| الشفافية | تضمينات غير شفافة | ملفات Markdown واضحة |
| التراكم | لا شيء — كل استعلام يبدأ من جديد | كل مصدر يجعل الويكي أذكى |
| الصيانة | تحديثات يدوية مطلوبة | النموذج يتولى التنظيم |
| النطاق الأمثل | مجموعات مستندات كبيرة | شخصي إلى مؤسسي (حوالي 100 مقال، 400 ألف كلمة) |
على نطاق قاعدة معرفة شخصية — حوالي 100 مقال و400,000 كلمة — قدرة النموذج على التنقل عبر الملخصات وملفات الفهرس أكثر من كافية. بنية RAG المعقدة غالباً ما تضيف تأخيراً وضوضاء استرجاع أكثر مما تحل.
حالات الاستخدام الواقعية
يصف كارباثي عدة تطبيقات مقنعة:
- التطوير الشخصي: تتبع الأهداف والرؤى الصحية والنفسية من خلال يوميات ومقالات منتقاة. بناء صورة منظمة عن نفسك بمرور الوقت.
- البحث العلمي: قراءة أوراق بحثية لأسابيع أو أشهر بينما يلتقط ويكي متطور أطروحتك النامية، حيث تعزز كل ورقة جديدة الفهم القائم أو تتحداه.
- رفيق القراءة: بناء ويكي معجبين أثناء قراءة كتاب — الشخصيات والمواضيع وخيوط الحبكة، كلها مترابطة تلقائياً.
- ذكاء الأعمال: تغذية محادثات Slack ونصوص الاجتماعات ومكالمات العملاء في ويكي يبقى محدّثاً لأن الذكاء الاصطناعي يقوم بالصيانة التي لا يريد أحد القيام بها.
لماذا مشكلة الصيانة مهمة
السبب في موت معظم قواعد المعرفة ليس نقص المعلومات — بل نقص الصيانة. المراجع التبادلية تصبح قديمة، المعلومات الجديدة تتناقض مع الصفحات القديمة، وعبء الحفاظ على الاتساق ينمو أسرع من قيمة إضافة محتوى جديد.
نماذج اللغة تحل هذه المشكلة لأنها لا تشعر بالملل. لا تنسى تحديث مرجع تبادلي. يمكنها تعديل 15 ملفاً في مرور واحد. عبء الصيانة الذي يقتل الويكيات التي يديرها البشر يصبح تافهاً لوكيل ذكاء اصطناعي.
كيف تبدأ
النمط مجرد بعمد — شاركه كارباثي كـ "ملف فكرة" وليس كتطبيق صارم. في عصر وكلاء LLM، تشارك المفاهيم، ووكيل كل شخص يبني نسخة مخصصة.
إليك نقطة بداية بسيطة:
- أنشئ مجلد مصادر خام لمستنداتك الأصلية
- أعد مجلد ويكي حيث سيكتب النموذج ملفات Markdown
- اكتب مستند مخطط (CLAUDE.md أو ما شابه) يصف بنية الويكي وأنواع الصفحات والاتفاقيات
- ابدأ بالاستيعاب — أضف مصدراً واحداً في كل مرة ودع الويكي ينمو تدريجياً
المفتاح هو البدء صغيراً. موضوع واحد. بضعة مصادر. دع الويكي ينمو عضوياً مع استكشافك.
الصورة الأكبر
يمثل نمط ويكي LLM تحولاً في طريقة تفكيرنا حول الذكاء الاصطناعي والمعرفة. بدلاً من معاملة نماذج اللغة كمحركات بحث تجيب على الأسئلة عند الطلب، نعاملها كعمال معرفة يبنون ويحافظون على منتجات فكرية دائمة.
كما يقول كارباثي: في هذا النهج، جزء كبير من استهلاك التوكنات لا يذهب لمعالجة الكود بل لمعالجة المعرفة. الويكي يصبح نموذجاً حياً للمجال نفسه — معبّراً عنه بنص، لا بمصفوفات رقمية.
لأي شخص يقضي وقتاً كبيراً في البحث أو التعلم أو إدارة المعلومات، يقدم هذا النمط شيئاً لم يستطع RAG تقديمه أبداً: معرفة تتراكم وتنمو.
ناقش مشروعك معنا
نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.
دعنا نجد أفضل الحلول لاحتياجاتك.