لقد كان الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي يتقدم بوتيرة مذهلة على مدى الأشهر العشرة الماضية، وقد غيّر نموذج الانتشار المكاني الزماني الجديد الرائع من Google، Lumiere، أهداف الهدف مرة أخرى. يستطيع Lumiere إنشاء مقاطع فيديو سريالية واقعية جدًا أو عالية الجودة تصل مدتها إلى 5 ثوانٍ. يمكنه أيضًا تحريك الصور الثابتة أو أجزاء من الصور بناءً على مطالبات نص اللغة الطبيعية لإعلامك بما تريد رؤيته.
يمكنه التقاط صورة، واستنساخ نمط تلك الصورة، ثم استخدام هذا النمط لإنشاء عدد كبير من مقاطع الفيديو حول مواضيع أخرى تبدو متشابهة إلى حد كبير بحيث يمكن أن تنتجها وكالة العلامات التجارية.
يمكنه استخدام الفيديو المصدر الخاص بك لتحويل كل شيء إلى Lego أو أوريغامي أو زهور - ما عليك سوى إخباره.
كما ترون من العرض التوضيحي أعلاه، تتمتع Lumiere بميزة الفيديو الأكثر تقدمًا التي رأيناها حتى الآن. كل ما عليك فعله هو طلاء أجزاء الصورة التي لا تعجبك، وسيقوم Lumiere تلقائيًا بملء تلك المنطقة بتأثير جميل قد لا تلاحظه حتى إذا لم تنظر بعناية. يظهر صديقها السابق في الفيديو المفضل لديك؟ لن تكون طويلة.
ذكر فريق البحث ذو الصلة أن "بنية الشبكة المكانية والزمانية على شكل حرف U" الخاصة بـ Lumiere يمكنها إنشاء طول الفيديو بالكامل مرة واحدة - في حين أن النماذج السابقة عادةً ما تولد إطار البداية وإطار النهاية أولاً، ثم تخمن ما سيحدث في المنتصف.
بغض النظر عن كيفية القيام بذلك، فإن النتائج تتحدث عن نفسها — هذه هي الحالة الجديدة في فيديو الذكاء الاصطناعي الإبداعي.
في الوقت الحالي، هذا مجرد مشروع بحثي - حتى لا تضطر جوجل إلى إضعاف النظام بشكل كبير فيما يتعلق بحقوق الطبع والنشر، والمعلومات المضللة، والسلامة، وخطاب الكراهية، والعُري، والخصوصية، والعديد من السياسات الأخرى - وهي العملية التي ستؤدي حتما إلى انخفاض جودة مخرجات هذه النماذج التوليدية.