في مؤتمر مطوري I/O لهذا العام، أصدرت Google رسميًا الجيل الجديد من نماذج سلسلة Gemini 3.5 وسلسلة Gemini Omni الجديدة. كان Gemini 3.5 Flash هو الأول الذي تم فتحه للجمهور، بينما يركز Gemini Omni على القدرة على "إنشاء فيديو من أي مدخلات".
Gemini 3.5 Flash متاح بالفعل لجميع المستخدمين من خلال وضع الذكاء الاصطناعي في تطبيق Gemini وبحث Google. تدعي Google أن النموذج يتمتع بمستوى ذكاء يمكن مقارنته بالنماذج الرئيسية الكبيرة في العديد من الأبعاد، مع الحفاظ على الأداء المتسق عالي السرعة لسلسلة Flash.

وفقًا للمقدمة، يعد Gemini 3.5 Flash حاليًا أقوى وكيل Gemini ونموذج إنشاء الأكواد. بل إنه يتفوق على Gemini 3.1 Pro في الاختبارات المعيارية المتعلقة بالرموز المعقدة والوكلاء، ويحافظ على الريادة في الفهم متعدد الوسائط، لذلك تم تعيينه أيضًا كنموذج افتراضي حالي. يمكن للمستخدمين استدعاء هذا النموذج مباشرة في عمليات البحث اليومية والمحادثات داخل التطبيق والسيناريوهات الأخرى للحصول على إجابات أسرع وأكثر ذكاءً ودعم التعليمات البرمجية.
يمثل Gemini Omni، الذي تم الكشف عنه في نفس الوقت، أحدث محاولات Google في اتجاه الفيديو التوليدي. يمكن لهذا النموذج الجديد إنشاء مقاطع فيديو من أي مدخلات. يمكن للمستخدمين دمج الصور والصوت ومقاطع الفيديو والنص بحرية كمدخلات، ويقوم النموذج بإنشاء محتوى فيديو عالي الجودة استنادًا إلى معرفة Gemini الواقعية. بعد اكتمال عملية الإنشاء، يمكن للمستخدمين أيضًا إجراء جولات متعددة من تحرير المحادثة من خلال اللغة الطبيعية لتعديل وضبط التفاصيل في الفيديو.
النموذج الأول في سلسلة Gemini Omni هو Gemini Omni Flash، الذي يدعم التعديل الجزئي أو الكلي للفيديو ويمكنه الاستمرار في الاحتفاظ بالتماسك السردي للمشهد الأصلي خلال جولات متعددة من الإنشاء، مما يسمح للمستخدمين بالتعديل المستمر دون فقدان خط القصة الرئيسي. وقالت جوجل إن هذا النموذج يتمتع بفهم أكثر بديهية للمفاهيم الفيزيائية مثل الجاذبية والطاقة الحركية وديناميكيات الموائع، مما يسمح له بتوليد مشاهد ديناميكية أكثر واقعية ومصداقية.
فيما يتعلق بالتجربة الإبداعية، يتيح Gemini Omni للمستخدمين استخدام أصواتهم وصورهم الرمزية للمشاركة في إنشاء الفيديو، وبالتالي إنشاء صور رمزية رقمية ذات خصائص شخصية. من أجل التعامل مع مشكلات التتبع والأمن للمحتوى الاصطناعي، سيتم تضمين جميع مقاطع الفيديو التي تم إنشاؤها بواسطة هذا النموذج مع علامات مائية رقمية SynthID لوضع العلامات وتحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
من حيث التوفر، يتوفر Gemini Omni Flash للمشتركين العالميين بدءًا من اليوم. يمكن للمستخدمين المشتركين في خطط Google AI Plus وPro وUltra استخدام النموذج مباشرة في تطبيق Gemini وGoogle Flow. وفي الوقت نفسه، تقدم Google أيضًا هذه الإمكانية إلى YouTube Shorts وYouTube Create مجانًا، مما يسمح لمزيد من المبدعين بتجربة وظيفة إنشاء الفيديو استنادًا إلى تقنية Gemini على منصات المحتوى السائدة.