كارباثي في Anthropic: رهان التدريب المسبق بالذكاء الاصطناعي

في 19 مايو 2026، نشر أندريه كارباثي تحديثاً من ثلاث جمل: لقد انضم إلى Anthropic، والسنوات القليلة القادمة في نماذج اللغة الكبيرة ستكون "بالغة الأهمية"، ويخطط للعودة إلى عمله التعليمي "في الوقت المناسب". ثلاث جمل فقط. أكثر من 5800 منشور على منصة X خلال 48 ساعة.

لم يكن هذا ضجيجاً — بل كان إشارة حقيقية. هذه واحدة من أهم التحركات في مجال أبحاث الذكاء الاصطناعي منذ تأسيس المختبرات الكبرى، وتحمل دلالات مباشرة لكل مطور يبني على Claude.

من هو أندريه كارباثي؟

شارك كارباثي في تأسيس OpenAI عام 2015، ثم انتقل لقيادة الذكاء الاصطناعي في Tesla (بناء البنية التحتية العصبية لنظام Autopilot من الصفر)، وبعدها أسس Eureka Labs — شركة تعليمية تعتمد الذكاء الاصطناعي في صميمها. وهو أيضاً الشخص الذي علّم المزيد من المطورين كيفية عمل نماذج اللغة الكبيرة فعلياً أكثر من أي شخص آخر على هذا الكوكب، من خلال سلسلته الأسطورية على YouTube حول المحولات والانتشار العكسي ونموذج nanoGPT.

قيمته الحقيقية لا تكمن فقط في اعتماداته البحثية. بل في الجمع النادر بين ثلاث مهارات لا تظهر مجتمعةً في شخص واحد إلا نادراً:

الفهم النظري العميق لكيفية تعلم نماذج اللغة الكبيرة
الخبرة الهندسية على نطاق واسع في تشغيل جلسات التدريب الإنتاجية بحجم ضخم
القدرة على جعل الأنظمة المعقدة مفهومة — تحويل عملية تدريب تضم مليار معامل إلى مبادئ يمكن الإمساك بها

المهارة الأخيرة تحديداً هي ما تحتاجه لبناء فريق يستخدم نموذج ذكاء اصطناعي واحداً لتدريب نسخة أفضل منه.

ما هو التدريب المسبق فعلياً؟

معظم المطورين يتفاعلون مع Claude في وقت الاستدلال: ترسل مطالبة وتحصل على استجابة. لكن القدرات التي تعتمد عليها تشكّلت خلال التدريب المسبق — المرحلة التي تسبق الضبط الدقيق وتقنية RLHF وأي عمل متعلق باتباع التعليمات.

في التدريب المسبق يتعلم النموذج اللغة والتفكير المنطقي والشفرة البرمجية والرياضيات والتمثيلات الكامنة التي تدعم كل شيء آخر. وهو أيضاً:

المرحلة الأكثر تكلفاً (مليارات الدولارات من الحوسبة)
الأكثر غموضاً (الإشارة التي تخبرك بما يعمل تأتي ببطء)
المرحلة التي تهمّ فيها المكاسب المتراكمة أكثر

تحسين بنسبة واحد بالمئة في جودة بيانات التدريب المسبق أو كفاءته لا يجعل النموذج أفضل بواحد بالمئة فقط. بل يتراكم عبر كل قدرة لاحقة. لهذا السبب تعتبر مختبرات الحافة التقنية أبحاث التدريب المسبق أمراً وجودياً.

مفهوم الذكاء الاصطناعي على الذكاء الاصطناعي: Claude يدرّب Claude

هذا هو الإطار المحدد الذي أعطته Anthropic لمهمة كارباثي: استخدام Claude نفسه لتسريع أبحاث التدريب المسبق.

ماذا يعني ذلك عملياً؟ تأمل ما تتضمنه أبحاث التدريب المسبق:

تصميم التجارب (ما هو مزيج البيانات، وما هي التغييرات المعمارية، وما هي نطاقات المعاملات الفائقة للاختبار)
كتابة كود السقالات التجريبية
تحليل منحنيات التدريب وأنماط الفشل
قراءة مئات الأوراق البحثية لتركيب ما يعرفه المجال
كتابة النتائج وتحديد الاتجاهات التي يجب اتباعها

في عام 2024، كان كل هذا عملاً بشرياً حصراً. في عام 2026، يمكن لـ Claude تنفيذ أجزاء كبيرة من الخطوات 1 إلى 5. ليس بكمال، وليس باستقلالية تامة — لكن بما يكفي لضغط دورة التكرار بشكل كبير.

مهمة كارباثي هي بناء الفريق الذي يُشغّل هذه الحلقة: باحثون يعرفون الأسئلة الصحيحة للطرح، جنباً إلى جنب مع Claude كمسرّع للبحث يمكنه اقتراح التجارب وكتابة كود السقالات وإبراز الأدبيات ذات الصلة والإشارة إلى الشذوذات في سجلات التدريب.

هذا هو بحث الذكاء الاصطناعي على الذكاء الاصطناعي ليس كمفهوم نظري، بل كسير عمل إنتاجي حقيقي.

لماذا يتفوق هذا على الحوسبة الخام؟

النموذج الساذج لتقدم الذكاء الاصطناعي هو: المزيد من الحوسبة يساوي نماذج أفضل. اشترِ المزيد من وحدات GPU، دِرّب لفترة أطول، وفُز. Google تمتلك أكثر حوسبة. OpenAI لديها وصول هائل. سباق الحوسبة حقيقي.

لكن توظيف كارباثي يشير إلى شيء تؤمن به Anthropic بشدة: سرعة البحث أهم من الحوسبة الخام في الهامش الحالي.

إليك السبب. قرارات التدريب المسبق — البيانات التي تستخدمها، وكيفية ترجيحها، والاختيارات المعمارية التي تتخذها قبل بدء الجلسة — تحدد مدى كفاءة استخدامك لميزانية الحوسبة. جلسة تدريب مُصممة جيداً بـ 10,000 وحدة GPU يمكن أن تتفوق على جلسة مُصممة بشكل رديء بـ 50,000 وحدة GPU.

سرعة البحث هي مدى سرعة اختبارك للفرضيات، والتعلم من الفشل، وتحديث افتراضاتك قبل الجلسة الكبيرة التالية. إذا استطاع Claude ضغط دورة تجريبية مدتها أسبوعان إلى ثلاثة أيام، فإن Anthropic تُجري تجارب أكثر مقابل كل دولار من الحوسبة. هذه ميزة تتراكم بمرور الوقت.

ماذا يعني هذا للمطورين الذين يبنون على Claude؟

إذا كنت تبني تطبيقات على Claude اليوم، فلديك حصة مباشرة في هذا الاتجاه البحثي. إليك ما يجب مراقبته:

أسس استدلالية أقوى

تحسينات التدريب المسبق تظهر عادةً أولاً في المعايير المرجعية، ثم في المهام التي يهتم بها المطورون فعلاً: سلاسل الاستدلال المعقدة، ودقة توليد الكود، وحل المسائل الرياضية. مع ضغط فريق كارباثي لدورة البحث، ينبغي أن تصل التحسينات إلى النماذج الإنتاجية بشكل أسرع.

موثوقية أعلى في سير العمل الوكيلي

أحد القيود المعروفة لـ Claude في سير عمل الوكلاء هو الموثوقية عبر آفاق مهام طويلة — يمكن للنموذج الانجراف أو افتراض معلومات خاطئة عبر عمليات متعددة الخطوات. جودة بيانات التدريب المسبق والاختيارات المعمارية هي أسباب جذرية لهذا. البحث بمساعدة الذكاء الاصطناعي يمكنه إجراء تجارب أكثر استهدافاً على موثوقية الآفاق الطويلة.

إصدارات نماذج أسرع

إذا قصُرت دورة التكرار، يتقلص الوقت بين إصدارات Claude الرئيسية. للمطورين، هذا يعني ترقيات قدرات أكثر تكراراً — وضغطاً أكبر لتصميم تطبيقات تتكيف مع تحسينات النموذج دون ارتباط صارم بسلوكيات محددة.

إشارة المواهب

تحرّك كارباثي هو أيضاً بيان حول مكان أكثر أبحاث الحافة إثارةً للاهتمام. كان بإمكانه البقاء مستقلاً أو الانضمام لأي مختبر. اختار فريق التدريب المسبق في Anthropic — ليس المنتج، وليس النشر، وليس الضبط الدقيق. أبحاث التدريب الأساسية.

للباحثين الذين يراقبون من الخارج، هذه إشارة حول المكان الذي تقع فيه أصعب المشكلات غير المحلولة، وأي مختبر يخلق ظروف العمل عليها بجدية.

للمؤسسات التي تُقيّم مزود الذكاء الاصطناعي للبناء عليه، هذه إشارة حول المسار التقني على المدى البعيد. فريق التدريب المسبق هو الفريق الذي يحدد ما سيكون Claude قادراً عليه بعد عامين.

ما يجب مراقبته لاحقاً

بعض المؤشرات المحددة التي تستحق التتبع:

المنشورات البحثية. إذا أنتج فريق كارباثي نتائج تستحق المشاركة، فمن المتوقع ظهورها في مسارات أبحاث التفسيرية والمواءمة في Anthropic.

تكامل Claude Code. إطار Anthropic يذكر Claude Code صراحةً كجزء من سير عمل الذكاء الاصطناعي على الذكاء الاصطناعي. باحثو كارباثي على الأرجح مستخدمون مكثفون، مما يجعل فجوات القدرات في Claude Code أولويات بحثية مباشرة.

التقدم في المعايير المرجعية للمهام الصعبة. راقب درجات ARC-AGI وFrontierMath وLiveCodeBench عبر أجيال النماذج. إذا كان بحث التدريب المسبق بمساعدة الذكاء الاصطناعي يعمل، ينبغي أن تتصاعد تلك المنحنيات.

الصورة الأكبر

ثمة شيء مثير للاهتمام تاريخياً يحدث هنا. الشخص الذي جعل تدريب الشبكات العصبية مفهوماً لجيل كامل من المهندسين يستخدم الآن تلك المعرفة لجعل الذكاء الاصطناعي نفسه باحثاً أفضل.

كارباثي دائماً ما عمل عند تقاطع العمل التقني الصعب وجعله مفهوماً. الرهان الذي تُقدم عليه Anthropic هو أن هذه المهارة — بناء أنظمة يمكنها استيعاب تطورها الذاتي وتسريعه — هي القدرة البحثية الأكثر أهمية في الحافة التقنية الحالية.

إذا كانوا على حق، فإن الإصدار القادم من Claude لن يكون أكثر ذكاءً فحسب. بل سيكون قد تشكّل جزئياً بواسطة الإصدار الذي سبقه.

هذا نوع مختلف من تحسين الذكاء. ويستحق الانتباه.