اليوم، أصدرت Tencent رسميًا وفتحت المصدر لـ Hunyuan 3D World Model 2.0 (HY-World 2.0). وفقًا للتقارير، يعد HY-World 2.0 نموذجًا عالميًا متعدد الوسائط يمكنه فهم أنواع مختلفة من المدخلات مثل النصوص والصور ومقاطع الفيديو، وإنشاء عوالم ثلاثية الأبعاد وإعادة بنائها ومحاكاتها تلقائيًا. كما أنه يدعم تصدير الأصول ثلاثية الأبعاد متعددة التنسيقات (الشبكات/3DGS/السحب النقطية، وما إلى ذلك) ويمكن توصيله بسلاسة بسير عمل اللعبة الحالي لإنشاء خرائط اللعبة ونماذج المستويات الأولية بسرعة.

يُذكر أنه على عكس Genie 3 وHunyuan World Model 1.5 من Google، اللذين لا يمكنهما سوى إنشاء ملفات فيديو، فإن World Model 2.0 أكثر عملية: حيث يمكنه إنشاء ملفات أصول ثلاثية الأبعاد مباشرة يمكن تحريرها مرتين. يمكن استيراد هذه الأصول ثلاثية الأبعاد التي تم إنشاؤها مباشرةً إلى إنتاج اللعبة أو إلى محركات محاكاة مجسدة لتحقيق نتائج قابلة للتشغيل والاستخدام حقًا.

حاليًا، تم إطلاق World Model 2.0 على الموقع الرسمي لـ Tencent Hunyuan 3D Creation Engine، ويمكن للمستخدمين التقدم لاستخدامه.

يدعم Hunyuan World Model 2.0 مدخلات متعددة للنصوص والصور ومقاطع الفيديو. قم بإدخال جزء من النص أو الصورة، ويمكن للنموذج تحليل الدلالات المعقدة بدقة وإنشاء مجموعة متنوعة من العوالم القابلة للتجول بنقرة واحدة. بالمقارنة مع Hunyuan World Model 1.0، تمت ترقية بنية النموذج 2.0 بالكامل، وتم تحسين دقة الصورة وواقعيتها بشكل كبير. يمكن للمستخدمين أيضًا تخصيص النمط وإنشاء مساحات ثلاثية الأبعاد واقعية أو كوميدية أو على طراز اللعبة حسب الطلب. بعد اكتمال الإنشاء، يمكن للمستخدمين استيراد الأصول إلى محركات مثل Unity وUE للتحرير الثانوي، مما يقلل بشكل كبير من عتبة إنشاء خريطة اللعبة.

يدعم النموذج أيضًا وضع الشخصية. يمكن للمستخدمين تشغيل الشخصيات لاستكشاف الشوارع والمباني والمشاهد بحرية دون حدود زمنية واصطدامات جسدية، تمامًا كما هو الحال في اللعبة. وفي الوقت نفسه، يدعم World Model 2.0 تكرار المشاهد ثلاثية الأبعاد الحقيقية. يمكن للمستخدمين إدخال فيديو أو صورة متعددة العرض لمساحة حقيقية، ويمكن للنموذج إنشاء مساحة رقمية مزدوجة عالية الدقة. استنادًا إلى بنية WorldMirror 2.0 التي تمت ترقيتها، يدعم النموذج إدخال الصور والفيديو من أي حجم، ويتنبأ بالسحب النقطية الكثيفة، وخرائط العمق متعددة العرض، والأسطح الطبيعية ومعلمات الكاميرا في وقت واحد، ويولدها مرة واحدة ويمكن إعادة استخدامها بشكل دائم. في المستقبل، يمكن بناء واستعادة معاينة الديكور الداخلي والتخطيط الحضري وحماية التراث الثقافي وغيرها من السيناريوهات بسرعة بناءً على هذه الإمكانية.

يأخذ Hunyuan World Model 2.0 الأبعاد الثلاثية كمحور رئيسي ويحقق تأثيرات توليد على مستوى SOTA من خلال الفهم المكاني الموحد والتوليد وهندسة إعادة الإعمار. بالمقارنة مع النماذج العالمية الأخرى، يعمل Hunyuan World Model 2.0 بشكل أفضل في اكتمال المشهد (جوانب وخلفيات الكائنات) والامتثال للصور المدخلة. يتيح التمثيل المختلط لـ 3DGS وMesh الذي تم إنشاؤه بواسطة Hunyuan للمستخدمين أيضًا تشغيل وضع الشخصية للتفاعل مع تصادمات الكائنات الحقيقية.