وفقًا لموقع Weibo الرسمي لـ Bytedance Seed، أصدر فريق Bytedance Seed رسميًا جيلًا جديدًا من نموذج إنشاء الصور Seedream 4.0. وفقًا للتقارير، يستخدم Seedream 4.0 نفس البنية لتنفيذ إمكانات التحرير الرسومية والعامة، ودمج القدرات المنطقية والمنطقية. بالمقارنة مع نماذج الجيل السابق Seedream 3.0 وSeedEdit 3.0، حقق Seedream 4.0 اختراقات كبيرة في التأثيرات متعددة الوسائط والسرعة وسهولة الاستخدام:

توسيع اللعب متعدد الوسائط: يدعم بمرونة الإدخال المدمج للنص والصور، مما يسمح بالأوضاع الإبداعية مثل الصور المستندة إلى النص، والصور المستندة إلى الصور، وتحرير الصور، وتحرير الصور المتعددة، وإنشاء صور جماعية. طريقة اللعب إبداعية ومتنوعة.
جماليات محسّنة: تدعم درجة عالية من الحرية في ترحيل الأسلوب الفني، من الباروك إلى السايبربانك، وتتغير الأنماط باستمرار، ويمكن دمجها لإنشاء أنماط جديدة ذات جماليات رائعة.
الفهم المنطقي المعزز: بالاشتراك مع المعرفة العالمية، فإنه يعمل على تحسين فهم المدخلات متعددة الوسائط. يمكنه "الرسم" و"التفكير" أولاً، وإظهار قدرات التفكير والتوليد في المهام التي تنطوي على قيود مادية وزمنية، وحل الألغاز والكلمات المتقاطعة، والاستمرار في كتابة القصص المصورة.
الجيل التكيفي ودقة 4K: يمكن إنشاء الصورة الأفضل تناسبًا وفقًا للتعليمات أو الصور المرجعية، كما تدعم أيضًا الأحجام المحددة من قبل المستخدم. يمتد الحد الأقصى للدقة من 2K إلى 4K Ultra HD.
قفزة سرعة الاستدلال: من خلال تصميم معماري جديد وفعال وتسريع التقطير الشديد، تكون سرعة الاستدلال للرسوم البيانية التي تم إنشاؤها بواسطة DiT أعلى بأكثر من 10 مرات من سرعة Seedream 3.0.
وفقًا لموقع Weibo الرسمي، فإن Seedream 4.0 ليس مجرد نموذج لتوليد الصور، ولكنه أيضًا محرك إبداعي كامل متعدد الوسائط. استنادًا إلى أحدث إمكانيات Seedream 4.0، تم اقتراح ثمانية أساليب لعب أساسية للنموذج. بالإضافة إلى توليد الصور العامة وتحريرها، يتم أيضًا استكشاف إمكانات النموذج في إنشاء المشتقات وتوليد الاستدلال والتطبيقات المهنية.