OpenAI تضيف دعم WebSocket لواجهة Responses API مع تقليص زمن الاستجابة بنسبة 40% لوكلاء الذكاء الاصطناعي

أطلقت OpenAI دعم WebSocket لواجهة Responses API، في ترقية بنية تحتية مهمة مصممة لتقليص زمن الاستجابة بشكل كبير لوكلاء الذكاء الاصطناعي التي تعتمد بكثافة على استدعاءات الأدوات. يتيح الوضع الجديد اتصالات مستمرة ثنائية الاتجاه تلغي الحمل الزائد الناتج عن طلبات HTTP المتكررة، مما يوفر تنفيذاً أسرع بنسبة تصل إلى 40% لسير العمل المعقد.
أبرز النقاط
- تقليص زمن الاستجابة بنسبة تصل إلى 40% لسير العمل الذي يتضمن أكثر من 20 استدعاء أدوات
- اتصالات مستمرة عبر
wss://api.openai.com/v1/responses— دون الحاجة لإعادة إرسال سجل المحادثة الكامل في كل جولة - نمط الإدخال التزايدي — يتم إرسال البيانات الجديدة فقط (نتائج الأدوات، رسائل المستخدم) في كل جولة
- تحسين التسخين المسبق — إمكانية تحميل الأدوات والتعليمات مسبقاً قبل جولة التوليد الأولى
- متوافق مع سياسة عدم الاحتفاظ بالبيانات (ZDR) و
store=falseللنشر الحساس للخصوصية
كيف يعمل
بدلاً من دورة الطلب والاستجابة التقليدية عبر HTTP، يحافظ وضع WebSocket على اتصال مفتوح بين العميل وخوادم OpenAI. بعد حدث response.create الأولي، تتسلسل الجولات التالية عبر previous_response_id وترسل فقط المدخلات التزايدية — نتائج الأدوات الجديدة أو رسائل المستخدم.
يحتفظ الخادم بحالة الاستجابة السابقة في ذاكرة مؤقتة محلية للاتصال، مما يعني عدم الحاجة لإعادة إرسال السياق الكامل في كل مرة. هذه البنية مفيدة بشكل خاص لسير العمل الوكيلي حيث يستدعي الذكاء الاصطناعي أدوات خارجية بشكل متكرر.
تتيح ميزة التسخين المسبق للمطورين إرسال generate: false لتجهيز الأدوات والتعليمات مسبقاً، بحيث تبدأ جولة التوليد الفعلية الأولى بشكل أسرع.
لماذا هذا مهم
مع تزايد تعقيد وكلاء الذكاء الاصطناعي، أصبحت تعتمد بشكل متزايد على سلاسل من استدعاءات الأدوات — البحث في قواعد البيانات، واستدعاء واجهات API، وتنفيذ الأكواد، وغيرها. في نموذج HTTP القياسي، كانت كل جولة تتطلب إعادة إرسال سجل المحادثة بالكامل، مما يخلق عنق زجاجة متزايد في زمن الاستجابة.
أفادت مساعدات البرمجة مثل Cursor بالفعل عن تحسن في السرعة بنسبة 30% باستخدام وضع WebSocket الجديد. بالنسبة للمطورين الذين يبنون وكلاء ذكاء اصطناعي يعملون في الخلفية أو خطوط أنابيب متعددة المراحل، يعد هذا تحسيناً جوهرياً في البنية التحتية.
القيود
يحتوي وضع WebSocket على حد اتصال مدته 60 دقيقة، وبعدها يجب على العملاء إعادة الاتصال. يمكن معالجة استجابة واحدة فقط في كل اتصال (بدون تعدد الإرسال)، والجولات الفاشلة تحذف حالتها المخزنة مؤقتاً لمنع إعادة استخدام بيانات قديمة.
ما التالي؟
يشير وضع WebSocket إلى توجه OpenAI الأوسع نحو دعم وكلاء ذكاء اصطناعي مستمرين ودائمي العمل. مع انتقال الصناعة من التفاعلات أحادية الأمر إلى سير العمل المستقل طويل المدى، تصبح البنية التحتية منخفضة زمن الاستجابة كهذه ضرورية.
يمكن للمطورين البدء باستخدام وضع WebSocket اليوم عبر الاتصال بـ wss://api.openai.com/v1/responses مع مصادقة رمز Bearer.
المصدر: OpenAI — توثيق وضع WebSocket
ناقش مشروعك معنا
نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.
دعنا نجد أفضل الحلول لاحتياجاتك.