فليب بوك: نموذج أولي يبث كل بكسل من نموذج ذكاء اصطناعي ويستبدل HTML

AI Bot
· بواسطة AI Bot

جاري تحميل مشغل تحويل النص إلى كلام الصوتي...

كشف فريق صغير من مهندسين سابقين في OpenAI وآبل وسلاك يوم 23 أبريل 2026 عن فليب بوك (Flipbook)، نموذج أولي لواجهة تبث كل بكسل على شاشة المستخدم مباشرة من نموذج ذكاء اصطناعي، دون أي HTML أو CSS أو محرك تخطيط أو شيفرة برمجية. انتشر المشروع بسرعة على منصة X خلال ساعات، محققًا عشرات الآلاف من المشاركات، وتحول إلى أحد أكثر عروض الذكاء الاصطناعي تداولًا هذا الأسبوع.

كتب المؤسس المشارك زين شاه في إعلانه: "تخيل أن كل بكسل على شاشتك يُبث مباشرة من نموذج ذكاء اصطناعي. لا HTML، ولا محرك تخطيط، ولا شيفرة. فقط بالضبط ما تريد رؤيته".

أبرز النقاط

  • بناه زين شاه (سابقًا في OpenAI وسامسونغ وY Combinator S13)، وإدي جياو (سابقًا في Humane وSlack)، ودرو أوكار (سابقًا في آبل).
  • يبث فيديو بدقة 1080p بمعدل 24 إطارًا في الثانية مباشرة إلى المتصفح عبر WebSockets.
  • يستخدم LTX Studio، نموذج DiT مفتوح المصدر من شركة Lightricks الإسرائيلية، محسّنًا للعمل على وحدات معالجة الرسومات اللاخوادمية في Modal Labs.
  • أي منطقة في الصورة المولّدة تفاعلية، والنقرات تُعيد توليد المشهد بدلًا من تشغيل روابط ثابتة.
  • العرض التوضيحي متاح على flipbook.page.

التفاصيل

يستبدل فليب بوك خط أنابيب عرض الويب بأكمله بنموذج فيديو توليدي. عندما يطرح المستخدم سؤالًا، ويُظهر عرض الفريق مخطط رحلة إلى باريس، ينتج النموذج صفحة مصورة بملء الشاشة في حوالي 40 ثانية. النقر على برج إيفل يُكبره، والنقر على سعر تذكرة يفتح لوحة حجز، والنقر على معلم آخر يُعيد تشكيل الصفحة بالكامل إلى مشهد جديد. لا توجد عناصر HTML خلف اللوحة، فكل زر ظاهر وخريطة وعنوان وفقرة نصية يُرسم بكسلًا بكسل بواسطة النموذج.

حسّن الفريق LTX Studio لبث المخرجات بدقة 1080p و24 إطارًا في الثانية عبر WebSockets، مع توفير Modal Labs للبنية التحتية لوحدات GPU اللاخوادمية. ولأنه لا يوجد محرك تخطيط، تُعيد الرسوم التوضيحية تشكيل نفسها تلقائيًا لتناسب أي حجم نافذة أو نسبة عرض إلى ارتفاع، وهو سلوك يتطلب عادة CSS استجابي.

التأثير

يأتي فليب بوك في خضم نقاش أوسع حول ما إذا كانت الواجهات الأصلية للذكاء الاصطناعي ستحل في نهاية المطاف محل الواجهات الأمامية المكتوبة يدويًا. قارن مطورون على X بينه وبين تجارب "واجهات مولّدة بالذكاء الاصطناعي" الأسبق من Anthropic وجوجل، لكنهم لاحظوا أن فليب بوك يدفع الفكرة أبعد بإزالته DOM كليًا. نشر مهتمون بالمصادر المفتوحة، بما في ذلك Grok، وصفات لإعادة إنتاج مكدس شبيه بفليب بوك محليًا باستخدام Ollama وComfyUI وFlux لتوليد الصور.

أشار المنتقدون إلى مقايضات واضحة: إمكانية الوصول وتحسين محركات البحث وتعبئة النماذج وزمن الاستجابة، كلها أصعب عندما لا يستطيع المتصفح قراءة ترميز منظم. واعترف شاه بنفسه بأن النموذج الأولي بطيء وأن كثيرًا من مقاطع العرض كانت مسرّعة أو محررة.

الخلفية

عمل زين شاه سابقًا في أبحاث الذكاء الاصطناعي والروبوتات في OpenAI وشغل منصب خبير تكنولوجيا إبداعية في سامسونغ، وهو خريج Y Combinator دفعة S13. كان إدي جياو مهندسًا في Humane وSlack، ودرو أوكار مهندسًا سابقًا في آبل. بنى الفريق فليب بوك كمشروع مستقل وأطلقه كتجربة مفتوحة وليس كمنتج تجاري.

ما التالي

قال شاه إن فليب بوك "مصمم اليوم حول التفسيرات البصرية" لكنه ألمح إلى طموحات أوسع. كتب: "كلما أصبحت النماذج أكثر دقة وأكثر احتفاظًا بالحالة، ستتوسع مجموعة الأشياء التي تستحق الإنجاز بهذه الطريقة، حتى تلك التي تفترض أنها تحتاج إلى واجهات منظمة، مثل البرمجة". يلتقط الفريق الآن ملاحظات موجة الإطلاق ويعمل على الاستقرار، إذ كان العرض العام غير متاح بشكل متقطع منذ الإعلان بسبب الطلب.

بالنسبة لمطوري الويب، بما في ذلك الفرق التي تبني منتجات React وNext.js الحديثة وأنظمة تصميم ثقيلة في noqta.tn، فإن فليب بوك استفزاز فكري أكثر منه أداة إنتاج. لكنه يُبلور سؤالًا ستحتاج الصناعة للإجابة عليه في السنوات القليلة القادمة: إذا كان النموذج قادرًا على رسم الواجهة بأكملها، فما دور شيفرة الواجهة الأمامية؟


المصدر: Flipbook


هل تريد قراءة المزيد من الأخبار؟ تحقق من أحدث مقال إخباري لدينا على جوجل ديب مايند تطلق Gemini 3.1 Flash TTS بأكثر من 200 وسم صوتي.

ناقش مشروعك معنا

نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.

دعنا نجد أفضل الحلول لاحتياجاتك.