أندريه كارباثي يقدم قواعد المعرفة بالذكاء الاصطناعي، نموذج جديد يتجاوز تقنية RAG

قدّم أندريه كارباثي، الرئيس السابق للذكاء الاصطناعي في تسلا والمؤسس المشارك لشركة OpenAI، منهجية عمل جديدة أطلق عليها اسم "قواعد المعرفة بنماذج اللغة الكبيرة" والتي تكتسب زخمًا سريعًا في مجتمع المطورين. يقترح المفهوم استخدام نماذج اللغة الكبيرة ليس فقط للإجابة على الأسئلة، بل لبناء وصيانة ويكي شخصي منظم بشكل تدريجي — أداة معرفية مستمرة تزداد ذكاءً مع مرور الوقت.
أبرز النقاط
- نماذج اللغة الكبيرة تبني وتصون ويكي منظم بصيغة Markdown من المستندات الخام
- المنهجية تتجاوز تقنية RAG التقليدية بإنشاء طبقة معرفية مستمرة ومتطورة
- ويكي كارباثي الشخصي يحتوي بالفعل على نحو 100 مقال وأكثر من 400,000 كلمة
- النظام يستخدم Obsidian كواجهة أمامية وgit للتحكم في الإصدارات
بنية من ثلاث طبقات
يُبنى النظام حول ثلاث طبقات متميزة. في القاعدة يوجد دليل المصادر الخام الذي يحتوي على مستندات منسقة غير قابلة للتغيير — مقالات وأوراق بحثية وصور وملفات بيانات تمثل مصدر الحقيقة.
فوق ذلك يقع الويكي نفسه: مجموعة من ملفات Markdown المُولّدة بالذكاء الاصطناعي، منظمة حسب الكيانات والمفاهيم والملخصات والروابط المتبادلة. يمتلك النموذج اللغوي هذه الطبقة بالكامل، حيث ينشئ الصفحات ويحدثها عند وصول مصادر جديدة.
في الأعلى يوجد المخطط، وهو مستند تكوين يحدد بنية الويكي واصطلاحات التسمية وسير العمل التشغيلي.
آلية العمل
يدور سير العمل حول ثلاث عمليات أساسية:
الاستيعاب — عندما تصل مواد مصدرية جديدة إلى الدليل الخام، يعالجها النموذج اللغوي ويستخرج المعلومات الرئيسية ويحدث الصفحات الموجودة ويدمج النتائج في التوليف المتطور.
الاستعلام — يطرح المستخدمون أسئلة على الويكي، ويقوم النموذج بتوليف الإجابات من الصفحات ذات الصلة. يمكن اختياريًا حفظ النتائج كصفحات ويكي جديدة، مما يعني أن الإجابات تتراكم بدلاً من الاختفاء في سجل المحادثات.
التدقيق — فحوصات صحية دورية تحدد التناقضات والادعاءات القديمة والصفحات المعزولة والروابط المفقودة، لضمان سلامة البيانات مع نمو الويكي.
لماذا يتفوق هذا على RAG
تسترجع أنظمة RAG التقليدية المستندات الخام عند كل استعلام، وتعيد اشتقاق السياق في كل مرة. منهجية كارباثي تقلب هذا النموذج: يقوم النموذج اللغوي بمعالجة المعرفة وتوليفها مسبقًا في طبقة مستمرة تزداد غنى مع كل تفاعل.
كما أشار كارباثي، فإن جزءًا كبيرًا من استهلاكه الأخير للرموز يتجه أقل نحو معالجة الكود وأكثر نحو معالجة المعرفة. يقوم الإنسان بتنسيق المصادر وطرح الأسئلة بينما يتولى النموذج اللغوي العمل الشاق من تلخيص وربط متبادل وصيانة.
مجموعة الأدوات
يعتمد النظام على Obsidian كواجهة أمامية لتصفح الويكي وتحريره. يحوّل امتداد Web Clipper مقالات الويب إلى ملفات Markdown نظيفة. يستعلم Dataview عن البيانات الوصفية، ويوفر git التحكم الطبيعي في الإصدارات.
ظهرت بالفعل منظومة متنامية من التطبيقات، بما في ذلك Sage Wiki وBinder ومتغيرات متخصصة لأبحاث التداول والدراسة الأكاديمية وتسجيل المعرفة الصوتي.
التأثير على المطورين والباحثين
حقق المنشور أكثر من 30,000 تفاعل على منصة X وأطلق موجة من التطبيقات مفتوحة المصدر. ينجذب المطورون بشكل خاص لفكرة أن المعرفة تتراكم بدلاً من أن تتلاشى — كل جلسة بحثية تخلف وراءها أدوات منظمة يمكن للاستعلامات المستقبلية البناء عليها.
ما التالي
مع استمرار نمو نوافذ السياق في نماذج اللغة الكبيرة وتحسن قدرات الوكلاء، يمكن أن يصبح نمط الويكي كقاعدة معرفية سير عمل معياري لأي شخص يتعامل مع كميات كبيرة من المعلومات.
المصدر: أندريه كارباثي على GitHub
ناقش مشروعك معنا
نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.
دعنا نجد أفضل الحلول لاحتياجاتك.