Cursor Composer 2.5 يضاهي Claude Opus 4.7 بعُشر التكلفة

أصدرت Cursor نموذج Composer 2.5 في الثامن عشر من مايو 2026، وهو الجيل الثاني من نموذج البرمجة الداخلي للشركة، والمبني على نقطة الانطلاق مفتوحة المصدر Kimi K2.5 من Moonshot AI. يضاهي النموذج Claude Opus 4.7 على معيار SWE-Bench متعدد اللغات بينما يكلّف نحو عُشر سعر كل رمز (token)، مما يُسجّل انتقال Cursor من مجرد غلاف لنماذج طرف ثالث إلى مختبر ذكاء اصطناعي بمستوى الواجهة الأمامية.

أبرز النقاط

يحقق Composer 2.5 درجة 79.8% على معيار SWE-Bench متعدد اللغات، متعادلاً تقريباً مع Claude Opus 4.7 الذي يحقق 80.5%.
على المعيار الداخلي CursorBench v3.1، يتقدم النموذج على Opus 4.7 بنسبة 63.2% مقابل 61.6% بالإعدادات الافتراضية.
التسعير القياسي هو 0.50 دولار لكل مليون رمز إدخال و2.50 دولار لكل مليون رمز إخراج، مع طبقة Fast بسعر 3 و15 دولاراً للتوجيه ذي الأولوية.
تم تدريب النموذج على 25 ضعف عدد المهام الاصطناعية مقارنة بـ Composer 2، ويستخدم تقنية جديدة للتعلم المعزز الموجّه مع تغذية راجعة نصية.

التفاصيل

وفقاً لمنشور إطلاق Cursor، فقد أُنفقت 85% من حوسبة التدريب على مرحلة ما بعد التدريب وليس على التدريب الأولي. صمّم الفريق تقنية جديدة تُدعى التعلم المعزز الموجّه بالتغذية الراجعة النصية، تقوم بإدراج إرشادات محلية في نقاط محددة يمكن للنموذج أن يتحسن فيها، ثم تستخدم التقطير على السياسة لتعديل احتمالات الرموز. تصف Cursor النتيجة بأنها تحسّن جوهري في الذكاء والسلوك، خاصة في المهام طويلة الأمد واتباع التعليمات المعقدة.

تتضمن التفاصيل الهندسية المكشوف عنها مُحسِّن Sharded Muon الذي يحقق خطوة تحسين بمدة 0.2 ثانية على نماذج بحجم تريليون معامل، وبنية Dual mesh HSDP التي تفصل أوزان الخبراء عن الأوزان الأخرى لتحسين استخدام معالجات الرسوميات. أكدت Cursor أيضاً شراكة تدريب بمستوى الواجهة الأمامية مع SpaceXAI لبناء نموذج أكبر بشكل ملحوظ باستخدام عشرة أضعاف الحوسبة عبر Colossus 2 وما يقارب مليون وحدة GPU بمعادل H100.

معايير الأداء والقيود

ليس Composer 2.5 متفوقاً عالمياً. على معيار Terminal-Bench 2.0 الذي يقيس مهام سطر الأوامر طويلة المدى، لا يزال GPT-5.5 يتصدّر بنسبة 82.7% مقابل 69.3% لـ Composer 2.5، أي بفجوة 13 نقطة تعترف بها Cursor باعتبارها أوضح حدود الأداء. لاحظ المراجعون المستقلون أن النموذج يتفوق في التعديلات المتوازية متعددة الملفات وحلقات التكرار داخل المحرر، لكنه يتأخر في المهام المستقلة الثقيلة على سطر الأوامر.

ركّز ردّ فعل المطورين على X ومنتديات التطوير على نسبة السعر إلى الأداء. تُصنّف معايير الأداء العامة من جهات ثالثة Composer 2.5 ضمن أفضل ثلاثة نماذج برمجة في العالم بتكلفة نحو 55 سنتاً لكل مهمة تمثيلية، أي أقل بكثير من تكلفة تشغيل Opus 4.7 Extra High أو GPT-5.5 Fast على أعباء عمل مكافئة.

الأثر

يأتي الإطلاق في خضمّ سباق تسلّح للبرمجة متعددة الوكلاء. تطلق Google Antigravity 2.0 و xAI Grok Build و OpenAI Codex و Anthropic Claude Code جميعاً ميزات تنسيق متعددة الوكلاء في الفترة نفسها. لم يعد السؤال التنافسي لمنتجات بيئات التطوير المتكاملة هو ما إذا كان النموذج قادراً على كتابة الشيفرة، بل مدى رخص وسرعة وتنسيق سرب من الوكلاء مع الحفاظ على تماسك قاعدة الشيفرة.

بالنسبة لفرق التطوير التي تدفع بالفعل مقابل استخدام النماذج المتقدّمة، يُغيّر Composer 2.5 معادلة الميزانية. مهمة كانت تكلّف بضعة دولارات من رموز Opus 4.7 يمكن تشغيلها الآن على Composer 2.5 بسنتات قليلة، مما يتيح لفرق المنتج إطلاق وكلاء متوازين على نفس مسار العمل دون إرهاق الفاتورة.

الخلفية

بدأت Cursor كنسخة معدّلة من Visual Studio Code بطابع ذكاء اصطناعي محلي، حيث كانت تستدعي نماذج OpenAI و Anthropic للإكمالات والمحادثة. قدّم Composer 1 أول نموذج داخلي مُركّز على السرعة داخل المحرر. وتوسّع Composer 2 ليشمل حلقات وكيل أطول. أما Composer 2.5 فهو أول إصدار يصبح فيه النموذج الخاص بـ Cursor منافساً قياسياً للنماذج المغلقة المتقدّمة من Anthropic و OpenAI، بدلاً من تموضعه بوصفه بديلاً أسرع لكن أضعف.

ما هو القادم

أكّدت Cursor أن شراكة SpaceXAI تستهدف تدريب نموذج أكبر بكثير من Composer 2.5 من الصفر، باستخدام عشرة أضعاف الحوسبة. يُضاعف عرض الإطلاق الاستخدام للأسبوع الأول، مما يوحي بأن Cursor تريد تحويل أكبر عدد ممكن من المستخدمين التجريبيين إلى خطط مدفوعة قبل أن يردّ المنافسون بتخفيضات سعرية خاصة بهم.

النمط الأوسع واضح: تتجمّع طبقة أدوات البرمجة بالذكاء الاصطناعي حول حفنة من المنتجات المتكاملة عمودياً والتي تمتلك كلاً من بيئة التطوير والنموذج الأساسي. ومن المرجح أن تتحدّد الاثنا عشر شهراً القادمة بأيٍّ من هذه المنتجات يمكنه تنسيق وكلاء متعددين على قاعدة شيفرة واحدة دون إنتاج فوضى دلالية.

المصدر: Cursor — تقديم Composer 2.5

أبرز النقاط

يحقق Composer 2.5 درجة 79.8% على معيار SWE-Bench متعدد اللغات، متعادلاً تقريباً مع Claude Opus 4.7 الذي يحقق 80.5%.
على المعيار الداخلي CursorBench v3.1، يتقدم النموذج على Opus 4.7 بنسبة 63.2% مقابل 61.6% بالإعدادات الافتراضية.
التسعير القياسي هو 0.50 دولار لكل مليون رمز إدخال و2.50 دولار لكل مليون رمز إخراج، مع طبقة Fast بسعر 3 و15 دولاراً للتوجيه ذي الأولوية.
تم تدريب النموذج على 25 ضعف عدد المهام الاصطناعية مقارنة بـ Composer 2، ويستخدم تقنية جديدة للتعلم المعزز الموجّه مع تغذية راجعة نصية.