الكتابات/blog/2026/05
Blog19 مايو 2026·6 دقيقة

أزمة الحوسبة في الذكاء الاصطناعي: نقص GPU وحائط الطاقة

مهلة تسليم GPU انزلقت إلى 2027، مايكروسوفت لديها 80 مليار دولار من طلبات Azure غير القابلة للبناء، ووقت تشغيل Claude هبط إلى 98.95%.

طوال عامين كاملين، كانت كل الرسوم البيانية لتكلفة الذكاء الاصطناعي تشير في اتجاه واحد فقط: نحو الأسفل. هذه القصة انتهت. في ماي 2026، أصبحت واجهة OpenAI تعالج 15 مليار رمز (token) في الدقيقة، صعوداً من 6 مليارات في أكتوبر 2025. أسعار تأجير شرائح Blackwell من Nvidia قفزت بنسبة 48% في شهرين. وقت تشغيل واجهة Claude من Anthropic هبط إلى 98.95% خلال آخر 90 يوماً، أي أقل من معظم اتفاقيات مستوى الخدمة المؤسسية. وقال ساتيا ناديلا، الرئيس التنفيذي لمايكروسوفت، للمساهمين إن الشركة لم تعد مقيدة بالشرائح، بل مقيدة بالكهرباء، ولديها طلبات Azure بقيمة 80 مليار دولار لا تستطيع تنفيذها.

عصر الذكاء الاصطناعي الرخيص والوفير انتهى. ما يأتي بعده هو مشكلة شراء، وليس مشكلة نماذج. وهذا يغيّر كيفية تخطيط كل شركة لخارطة طريق الذكاء الاصطناعي لبقية سنة 2026.

أربعة اختناقات في وقت واحد

الأزمة ليست نقصاً واحداً، بل أربعة أنواع من النقص تضرب في نفس الوقت ويعزز بعضها بعضاً.

1. شرائح GPU. مهلة تسليم وحدات GPU لمراكز البيانات تتراوح الآن بين 36 و52 أسبوعاً. الشركات التي لم تطلب شرائح من فئة Blackwell قبل بداية 2026 تنتظر تسليماً في الربع الأول من 2027. شركة CoreWeave ترفع أسعار التأجير بأكثر من 20% وتشترط عقوداً أطول. السعة الفورية اختفت فعلياً للمسرّعات من الفئة العليا.

2. الذاكرة. ذاكرة النطاق الترددي العالي (HBM) هي الأزمة الصامتة وراء أزمة GPU. من المتوقع أن تستهلك الذاكرة نحو 30% من إنفاق مزودي السحابة الكبرى على الذكاء الاصطناعي في 2026، صعوداً من 8% في 2023 و2024. مزودو السحابة الكبرى أحكموا قبضتهم على ما يقارب 40% من إمدادات DRAM العالمية عبر عقود متعددة السنوات. أطقم DDR5 للخوادم التي كان سعرها حوالي 90 دولاراً سنة 2025 تُباع الآن بـ240 دولاراً أو أكثر.

3. المعالجات المركزية CPU. غالباً ما تُنسى في خضم سباق الذكاء الاصطناعي الوكيلي: كل حمل عمل ذكاء اصطناعي يحتاج معالجات لتنسيق المسرّعات. TSMC قادرة فقط على تلبية ما يُقدّر بـ80% من طلب رقائق المعالجات في 2026. مهلة تسليم معالجات الخوادم امتدت إلى ستة أشهر، وأسعار الفئات العليا ارتفعت بأكثر من 10%.

4. الكهرباء. هذا الاختناق لا يُحلّ في إطار زمني من 12 شهراً. تقرير CSIS الصادر في مارس 2026 — عنق زجاجة إمدادات الكهرباء في هيمنة الذكاء الاصطناعي الأمريكي — وجد أن أوقات انتظار الربط بالشبكة الكهربائية تصل إلى سبع سنوات في شمال فرجينيا. يُتوقع أن يصل طلب مراكز البيانات الأمريكية إلى 150 جيجاوات بحلول 2028، مع نقص قدره 49 جيجاوات بات مؤكداً. عالمياً، مراكز البيانات في طريقها لاستهلاك أكثر من 1000 تيراوات-ساعة في 2026، أي ما يعادل تقريباً استهلاك اليابان السنوي الكامل من الكهرباء.

صندوق ليوبولد آشينبرينر البالغ 13.7 مليار دولار جعل الصفقة علنية هذا الشهر: 7.5 مليار دولار من خيارات البيع على Nvidia وBroadcom وAMD وTSMC وOracle، مقابل مراكز شراء طويلة في البنية التحتية للطاقة وشركات التعدين والطاقة. أطروحته بسطر واحد: الذكاء الاصطناعي يحتاج الكهرباء قبل الشرائح. من يتحكم في الطاقة، يتحكم في المستقبل.

لماذا تتراجع الموثوقية

ما زالت معظم مجالس الإدارة تتعامل مع واجهات الذكاء الاصطناعي كأنها برمجيات كخدمة (SaaS): تفترض موثوقية بأربعة أصفار، وتبني المنتج على هذا الافتراض. هذا الافتراض يتحطم الآن.

وقت تشغيل Anthropic بـ98.95% على مدى 90 يوماً يعني نحو 9 ساعات من التوقف شهرياً. بالنسبة لوكيل ذكي يخدم العملاء مباشرة، هذه مشكلة جدية في تجربة المستخدم. سارة فراير، المديرة المالية لـOpenAI، أبلغت المستثمرين بأن الشركة "تتخذ مقايضات صعبة" وتؤجل أو تلغي مشاريع لأن قدرة الحوسبة ببساطة غير متوفرة. CoreWeave حذّرت العملاء في الربع الأول من أن السعة التعاقدية قد يُعاد توزيعها لمستأجرين يدفعون أكثر عندما تتراجع الشبكات الكهربائية.

إذا كانت ميزتك المعتمدة على الذكاء الاصطناعي تتطلب اتفاقية مستوى خدمة صارمة — كروبوت محادثة بنكي أو أداة فرز سريري — فإن النشر بمزود واحد أصبح خطراً تشغيلياً حقيقياً.

ماذا يعني هذا للشركات (وخاصة في منطقة الشرق الأوسط وشمال أفريقيا)

ثلاثة أمور تتغير في وقت واحد: التكلفة، والتوافر، والجغرافيا.

نماذج التكلفة تنهار. صفحات الأسعار لكل رمز (token) ما زالت معلنة، لكن السعر الفعلي هو السعة. الشركات التي تملك عقوداً ملتزمة سابقاً تدفع جزءاً يسيراً مما يدفعه العملاء الجدد. إذا بُنيت حالة عملك على أسعار 2024، فأعد حسابها.

التوافر يصبح شأن مجلس الإدارة. ميزات الذكاء الاصطناعي في الإنتاج تحتاج إلى مزودين احتياطيين، وسياسات إعادة المحاولة، وتدهور سلس عند ضيق السعة. سؤال "ما هي خطة استعادتنا إذا توقّف Anthropic لساعتين؟" أصبح سؤالاً مشروعاً في المراجعة الفصلية.

الجغرافيا تعود إلى الأهمية. الخليج يملك ما لا يملكه معظم العالم: طاقة رخيصة، ووفيرة، وقابلة للتوزيع. المملكة العربية السعودية والإمارات تُموقعان نفسيهما بقوة كمصدّرتيْن للحوسبة الذكية، ببناء حرم مخصص للذكاء الاصطناعي بإمدادات طاقة مضمونة. بالنسبة لشركات منطقة الشرق الأوسط وشمال أفريقيا، هذه فرصة من جيل لآخر: بنية تحتية سيادية إقليمية للذكاء الاصطناعي قد تكون فعلاً أكثر موثوقية من مناطق مزودي السحابة الكبرى في US-East بحلول 2027.

ست استراتيجيات للنجاة من الأزمة

لقادة الأعمال والهندسة الذين يتخذون قرارات الذكاء الاصطناعي خلال الأشهر الستة المقبلة:

  1. اختر النموذج بالحجم المناسب. معظم مهام الإنتاج لا تحتاج إلى استدلال متقدم. نموذج Haiku أو Llama-3.3 أو Mistral-Small مُحسّن جيداً يقدّم 95% من القيمة بـ10% من التكلفة، ولن يكون في طابور الانتظار خلف ChatGPT في أوقات الذروة.

  2. استخدم التخزين المؤقت بقوة. التخزين المؤقت للمطالبات (prompt caching) يمكنه تقليل تكلفة الاستدلال بنسبة تصل إلى 90% في أحمال العمل ذات السياق المتكرر. معظم الفرق لا تستخدمه بعد. راجع أحمال عملك بحثاً عن المطالبات النظامية والسياقات الطويلة المتكررة.

  3. ابنِ منذ اليوم الأول للتعامل مع مزودين متعددين. استعمل طبقة توجيه (LiteLLM أو OpenRouter أو حلاً خاصاً بك) قادرة على التحويل بين Anthropic وOpenAI وBedrock ونقطة نهاية مفتوحة الأوزان. اختبر التحويل كل ثلاثة أشهر، لا بعد أول انقطاع.

  4. انقل الأحمال الحساسة للزمن إلى البنية الداخلية أو الحافة. استضافة Qwen-3 أو Mistral أو Llama على GPU مخصص أصبحت تنافسية اقتصادياً بمجرد أن تأخذ بعين الاعتبار علاوات السعة ومخاطر اتفاقيات الخدمة. للأدوات الداخلية والتصنيف وإشراف المحتوى، الحسبة انقلبت.

  5. احجز عقود السعة الآن. إذا كانت خارطة طريق الذكاء الاصطناعي لديك تتطلب حجم استدلال معتبراً في النصف الثاني من 2026 أو في 2027، التزم بالأسعار والسعة الآن. الشركات التي ما زالت تتفاوض في الربع الثالث سيُقال لها: عودوا السنة المقبلة.

  6. راقب الخليج. HUMAIN السعودية، وG42 الإماراتية، والمبادرات الإقليمية الناشئة في تونس ومصر تبني سحابة مخصصة للذكاء الاصطناعي. بالنسبة لشركات المنطقة، زمن الوصول إلى دبي أو الرياض أقل من زمن الوصول إلى فرانكفورت، والقصة التنظيمية أوضح بكثير من المزودين الأمريكيين تحت قواعد بيانات الاتحاد الأوروبي.

إعادة التأطير الاستراتيجي

الشركات التي ستربح خلال الـ18 شهراً المقبلة لن تكون تلك ذات الطموحات الأكبر في الذكاء الاصطناعي، بل تلك التي تعاملت مع حوسبة الذكاء الاصطناعي كمورد مقيّد ومتنازع عليه، وهندست أنظمتها وفقاً لذلك. هذا يعني الكفاءة بدلاً من الحجم، والتكرار بدلاً من المراهنة على بائع واحد، وحجز السعة قبل أن يفعل بقية السوق.

عصر الذكاء الاصطناعي الرخيص كان نافذة، لا وجهة. النافذة أُغلقت. الشركات التي ما زالت تخطط كأنها مفتوحة هي التي ستقضي السنة المقبلة في شرح لمجالس إدارتها لماذا تأخرت خارطة طريق الذكاء الاصطناعي لديها فصلين كاملين.

إذا كنت تعيد بناء استراتيجيتك للذكاء الاصطناعي لمواجهة الأزمة، نقطة تساعد شركات منطقة الشرق الأوسط وشمال أفريقيا على تصميم هندسات ذكاء اصطناعي تنجو من انقطاعات المزودين، وإعادة توزيع السعة، والاقتصاديات الجديدة لحوسبة شحيحة.