الكتابات/news/2026/06
News4 يونيو 2026·6 دقيقة

إطلاق Ideogram 4.0 كأقوى نموذج ذكاء اصطناعي مفتوح الأوزان لتوليد الصور التصميمية

أطلقت Ideogram نموذج Ideogram 4.0 بحجم 9.3 مليار معامل، وهو نموذج مفتوح الأوزان يدعم دقة 2K أصلية وأفضل تصيير للنصوص داخل الصور وتحكمًا منظمًا في التخطيط. يتصدر النموذج لوحة DesignArena بين النماذج المفتوحة مع نشر الأوزان على Hugging Face والكود برخصة Apache 2.0.

أطلقت Ideogram نموذج Ideogram 4.0 في الثالث من حزيران/يونيو 2026، وهو نموذج لتوليد الصور من النص بحجم 9.3 مليار معامل، نُشر بأوزان مفتوحة على منصة Hugging Face مع كود الاستدلال على GitHub. يضع هذا الإصدار الانفتاح في صميم استراتيجيته التنافسية ضمن سوق الوسائط التوليدية المزدحم، ويأتي كأعلى نموذج مفتوح الأوزان تصنيفًا على لوحة DesignArena.

أبرز النقاط

  • 9.3 مليار معامل بأوزان مفتوحة — نُشرت أوزان النموذج على Hugging Face، فيما يوجد كود الاستدلال في مستودع ideogram-oss/ideogram4.
  • دقة 2K أصلية — يدعم أي دقة من 256 إلى 2048 بكسل (بمضاعفات الرقم 16) ونِسب أبعاد تصل إلى 6:1، ما يلغي الحاجة إلى خطوة تكبير منفصلة.
  • تصيير نصوص رائد — يقدّم أقوى طباعة نصية داخل الصور بين جميع الإصدارات المفتوحة التي خضعت للاختبار، متفوقًا على نماذج أكبر بكثير.
  • تحكم منظم في التخطيط — تحديد مواضع العناصر عبر مربعات إحاطة، وصياغة الطلبات بصيغة JSON، وضبط لوحة الألوان عبر قيم سداسية عشرية، وتوليد نصوص متعددة اللغات.
  • ترخيص مزدوج — الكود متاح برخصة Apache 2.0، بينما تخضع الأوزان لاتفاقية Ideogram غير التجارية للنموذج.

التفاصيل

يأتي Ideogram 4.0 في نسختين مكمَّمتين: نسخة nf4 تعمل على بطاقات الرسوميات المدعومة بـ CUDA وتدعم مكتبة Diffusers من Hugging Face، ونسخة fp8 تعمل على نطاق أوسع من العتاد. يتعامل النموذج مع أي دقة بين 256 و2048 بكسل مع ضبط تلقائي لجدول الضجيج، ويوسّع سكربت الاستدلال الطلبات النصية البسيطة إلى صيغة JSON منظمة عبر نموذج لغوي للطلبات الذكية قبل بدء التوليد.

هذا النهج المنظم هو محور توجه النموذج نحو التصميم. فبدلًا من معاملة الطلب ككتلة نصية واحدة، يقبل Ideogram 4.0 تحديدات بمربعات إحاطة لمواضع العناصر، وقيم ألوان سداسية عشرية لضبط اللوحة، وتعليمات صريحة للنص داخل الصورة — وهي أدوات تحكم تهمّ الشعارات والملصقات ونماذج المنتجات أكثر من الرسوم التوضيحية العامة.

على لوحة DesignArena، يحتل Ideogram 4.0 المرتبة الأولى بين جميع النماذج المفتوحة الأوزان والمرتبة التاسعة إجمالًا في ساحة تحويل النص إلى صورة، متخلفًا فقط عن نماذج مغلقة من OpenAI وGoogle. وبحجم 9.3 مليار معامل، يقدّم تصييرًا للنصوص أفضل من إصدارات مفتوحة أكبر بكثير، بما في ذلك Qwen-Image بحجم 20 مليار معامل، وFLUX.2 dev بحجم 32 مليارًا، وHunyuanImage 3.0 بحجم 80 مليارًا في تكوين مزيج الخبراء.

الأثر

يستحق الانقسام في الترخيص قراءة متأنية. فإصدار كود الاستدلال برخصة Apache 2.0 مع تقييد الأوزان باتفاقية غير تجارية يمنح الباحثين والهواة والفِرق التي تجري تقييمات في بيئات غير إنتاجية وصولًا عمليًا حقيقيًا، مع إبقاء النشر التجاري على مسار منفصل مدفوع. وهذا يعني أن الاستوديوهات والوكالات تستطيع اختبار النموذج محليًا ودمجه في النماذج الأولية قبل أي التزام ترخيصي.

أما بالنسبة للمطورين، فإن واجهة JSON المنظمة والتوجه نحو المخرجات القابلة للتحرير أهم من جودة الصورة الخام. فقد أشارت Ideogram إلى أن إصدارًا مقبلًا من 4.0 سيعيد قنوات الشفافية وطبقات النص القابلة للتحرير مباشرة من الاستدلال — دون خطوة ثانية ودون إخفاء (Masking) — بحيث يصبح ناتج النموذج ملفًا تستطيع فرق الإنتاج تسليمه مباشرة بدلًا من صورة مسطحة تحتاج إلى تنظيف لاحقًا.

ويبقى تسعير واجهة البرمجة متدرجًا لمن يفضّلون المسار المستضاف: نحو 0.03 دولار للصورة على مستوى Turbo، و0.06 دولار على المستوى الافتراضي، و0.10 دولار على مستوى الجودة.

الخلفية

تأسست Ideogram عام 2022 على يد باحثين سابقين في Google Brain، من بينهم محمد نوروزي، وجمعت 80 مليون دولار في مطلع 2024. وأطلقت أول نموذج عام لها في آب/أغسطس 2023، وبنت سمعتها المبكرة تحديدًا على تصيير النصوص — وهو نقطة ضعف في معظم نماذج الانتشار في تلك الحقبة. ويُعدّ الإصدار 4.0 أول إصدار للشركة يضع الأوزان المفتوحة في صميم تلك السمعة، وهو موزَّع بالفعل عبر أكثر من عشر منصات شريكة من بينها ComfyUI وLeonardo AI وPicsart.

ما هو القادم

السؤال المباشر هو مدى التبنّي: تجعل الأوزان المفتوحة إلى جانب أداء قوي في تصيير النصوص من Ideogram 4.0 أساسًا جذابًا للضبط الدقيق والاستضافة الذاتية، لكن رخصة الأوزان غير التجارية تُبقي الاستخدام الإنتاجي خلف جدار الدفع. ومن شأن تحديث الطبقات القابلة للتحرير الموعود — قنوات الشفافية والنص الحي مباشرة من الاستدلال — أن يدفع النموذج أكثر نحو كونه أداة تصميم لا مجرد مولّد للصور، وهذه هي القدرة التي ستترقبها فرق التصميم في الخطوة التالية.


المصدر: Ideogram