تأمل Google في اللحاق بـ OpenAI من خلال إطلاق Gemini

عندما يتعلق الأمر بالتكنولوجيا التي تقف وراء جنون الذكاء الاصطناعي الحالي، فإن شركة Alphabet's Google هي في الواقع المخترعة، لكن شعبية منتجاتها تراجعت بشكل كبير. وتأمل Google تغيير ذلك من خلال الإصدار المرتقب لـ Gemini، وهو "أكبر وأقوى نموذج لذكاء العمال" قامت الشركة ببنائه حتى الآن.

منذ النجاح الكبير الذي حققته OpenAI في العام الماضي من خلال برنامج الدردشة Chatbot ChatGPT، قام عدد متزايد من الشركات بتجربة الذكاء الاصطناعي التوليدي، وهي تقنية يمكنها أتمتة المهام مثل البرمجة أو تلخيص التقارير أو إنشاء حملات تسويقية بناءً على طلبات المستخدم. وفي عرض تقديمي قبل إطلاق المنتج في 6 ديسمبر، أكدت جوجل أن Gemini هو النموذج الأكثر مرونة الذي صنعته على الإطلاق، حيث يأتي في إصدارات بأحجام مختلفة، بما في ذلك الإصدار الذي يمكن تنفيذه مباشرة على الهاتف الذكي. وهذا ما يميزها عن المنافسين الآخرين.

نموذج الذكاء الاصطناعي هذا هو نظام يستخدم لدعم مختلف تطبيقات الذكاء الاصطناعي التوليدي. ويأتي في ثلاثة إصدارات مختلفة: GeminiUltra، وGeminiPro، وGeminiNano. وقال إيلي كولينز، نائب رئيس المنتجات في قسم DeepMind في Google، إن هذا التنوع يعني أن Gemini "يمكنه التنفيذ على كل شيء بدءًا من الأجهزة المحمولة وحتى مراكز البيانات الكبيرة".

وقال كولينز في مقابلة عبر الهاتف: "لقد أردنا منذ فترة طويلة بناء جيل جديد من نماذج الذكاء الاصطناعي المستوحاة من الطريقة التي يفهم بها الناس العالم ويتفاعلون معه، وهو ما يبدو وكأنه متعاون مفيد أكثر من كونه قطعة ذكية من البرمجيات". "الجوزاء يقربنا خطوة واحدة من تلك الرؤية."

قبل إصدار النموذج، اختبرت الشركة Gemini وفقًا لسلسلة من معايير الصناعة القياسية وقالت إن Gemini Pro تفوق على OpenAI's GPT-3.5 في ستة من أصل ثمانية اختبارات. وقالت جوجل إن Gemini تفوقت على GPT-4، أحدث إصدار من نموذج OpenAI للأغراض العامة، في سبعة من أصل ثمانية معايير لفهم اللغة العامة والاستدلال والرياضيات والترميز. وفي الوقت نفسه، تشير تقديرات جوجل إلى أن أحدث منتجها المولد للذكاء الاصطناعي، AlphaCode2، الذي يفسر ويولد كود البرنامج، يتفوق في الأداء بنسبة 85% على منافسيها في البرمجة التنافسية. ستصدر الشركة تقريرًا فنيًا يشرح بنية نموذج Gemini وعملية التدريب والتقييم بشكل أكثر تعمقًا.

بدءًا من 6 ديسمبر، سيتمكن مطورو Android الذين يرغبون في كتابة تطبيقات تعمل بنظام Gemini للهواتف الذكية والأجهزة اللوحية من التسجيل لاستخدام إصدار "nano" من نموذج الذكاء الاصطناعي هذا والذي يمكن تنفيذه مباشرة على هذه الأجهزة. وقالت جوجل أيضًا إنها ستقوم على الفور بتمكين Gemini على هاتفها الرائد Pixel 8 Pro، والذي سيدعم ميزات الذكاء الاصطناعي التوليدية الجديدة، مثل تلخيص النقاط الرئيسية من تسجيلات الهاتف. وفي الأسبوع المقبل، ستجعل Google برنامج GeminiPro متاحًا لعملاء السحابة من خلال منصتي VertexAI وAIStudio.

Gemini Ultra، النسخة الأكبر من نموذج الذكاء الاصطناعي من جوجل، ستكون متاحة مبدئيًا في برنامج وصول مبكر للمطورين وشركات المؤسسات، على أن يتم الإعلان عن تفاصيل حول البرنامج الأسبوع المقبل. سيتم طرح هذا الإصدار على نطاق واسع للجمهور في أوائل العام المقبل.

يتكامل Gemini أيضًا مع عدد كبير من تطبيقات وخدمات Google من خلال Bard، برنامج المحادثة التحادثي الخاص بالشركة والمنافس لـ ChatGPT. في السابق، استخدم Bard نموذج Google PaLM2، وهو نموذج لغوي واسع النطاق أعلنته الشركة في مؤتمرها السنوي للمطورين في شهر مايو.

تعرضت شركة جوجل لضغوط خلال العام الماضي لإعادة اختراع أعمال البحث الأساسية الخاصة بها وللتعامل مع صعود برامج الذكاء الاصطناعي التوليدية. على الرغم من أن الشركة تعتبر منذ فترة طويلة رائدة في أبحاث الذكاء الاصطناعي، إلا أن البعض انتقد إدارتها لبطءها في تسويق منتجات الذكاء الاصطناعي، خاصة بعد نجاح منتجات مثل ChatGPT ومولد الصور Dall-E. منذ أن أطلقت OpenAI GPT-4 في مارس، عملت جوجل على إعادة تأكيد ريادتها في هذا المجال، بما في ذلك حقن التكنولوجيا الجديدة في أعمال البحث الناضجة الخاصة بها.

الجوزاء هو رد الشركة على ضغوط السوق. تقول Google إن نموذج الذكاء الاصطناعي "متعدد الوسائط بشكل طبيعي"، مما يعني أنه تم تدريبه مسبقًا منذ البداية للتعامل مع المطالبات المستندة إلى النصوص والصور المقدمة من المستخدمين. على سبيل المثال، في عرض فيديو توضيحي، أظهرت جوجل أن الآباء يمكنهم مساعدة أطفالهم في إكمال واجباتهم المدرسية عن طريق تحميل صورة لمسألة رياضية معينة وصور لخطوات حل المشكلة على ورقة مسودة.

وفي الفيديو التجريبي، قال أبلباوم، مهندس البرمجيات في جوجل: "لا يستطيع برج الجوزاء حل هذه الأسئلة فحسب، بل يمكنه أيضًا قراءة الإجابات وفهم أي منها صحيح وأيها خطأ، وشرح المفاهيم التي تحتاج إلى مزيد من التوضيح". وقالت الشركة أيضًا إن "تجربة البحث التوليدية" - وهي نسخة تجريبية من محرك البحث الذي أنشأته جوجل باستخدام تقنية الذكاء الاصطناعي التوليدي - سيتم دمجها في ميزات جيميني الجديدة العام المقبل.

ومع ذلك، حذر ممثلو الشركة من أن برج الجوزاء لا يزال عرضة لـ "الهلوسة" أو المعلومات الكاذبة أو الملفقة التي ينتجها الذكاء الاصطناعي. يصف كولينز هذه الظاهرة بأنها "سؤال بحثي لم يتم حله". تم تسجيل الفيديو التجريبي الذي عرضته الشركة للصحفيين مسبقًا.

وقال كولينز إن جيميني "يمتلك التقييم الأمني الأكثر شمولاً لأي نموذج ذكاء اصطناعي في جوجل". ولتقييم أمان جيميني، أجرت جوجل اختبارًا تنافسيًا لنموذج الذكاء الاصطناعي، الذي يحاكي ممثلًا سيئًا يحاول استغلال البرنامج ويعطي المطالبات، على حد قوله. وتضمن الاختبار "مطالبات السمية الحقيقية"، وهو اختبار طوره معهد ألين للذكاء الاصطناعي ويحتوي على أكثر من 100 ألف مطالبة تم سحبها من الويب لمساعدة باحثي الذكاء الاصطناعي على فحص نماذج لغوية كبيرة لخطاب الكراهية والتحيز السياسي.

وشددت جوجل أيضًا على أن الأداة ستكون سريعة. وقالت الشركة إن جيميني يستخدم بنية أساسية جديدة للكمبيوتر العملاق ورقائق معالجة أحدث، مما يسمح له بأداء أسرع من النماذج الأصغر السابقة. تستخدم شركة جوجل إصدارًا جديدًا من رقاقتها السحابية، وهي وحدات معالجة Cloud Tensor (اختصارًا وحدات TPU)، وهي شريحة مصممة داخليًا يمكنها تدريب النماذج الحالية بمعدل أسرع 2.8 مرة من سابقتها. وقال أمين وحدات، نائب رئيس جوجل للتعلم الآلي، إن هذا النهج يمنح جوجل "نظرة جديدة على البنية التحتية القياسية للذكاء الاصطناعي في المستقبل". وأضاف أن الشركة ستظل تستخدم شرائح الذكاء الاصطناعي التابعة لجهات خارجية لتنفيذ نموذج جيميني الخاص بها.

سيتم دمج Gemini في Bard، وهو برنامج الدردشة الآلي المولد بالذكاء الاصطناعي من Google والذي تم إطلاقه في مارس، مما يتيح له الوصول إلى خدمات الشركة الأكثر شعبية، بما في ذلك Gmail والخرائط والمستندات وYouTube. سيتم الإطلاق على مرحلتين متميزتين: بدءًا من 6 ديسمبر، سيتم تشغيل Bard بواسطة GeminiPro، مما سيمكن من التفكير والتخطيط والفهم وقدرات أخرى عالية المستوى. وسيكون من الممكن تنفيذه باللغة الإنجليزية في 170 دولة ومنطقة، ولكن ليس بشكل خاص في أوروبا أو المملكة المتحدة، حيث قالت الشركة إنها تتشاور مع الهيئات التنظيمية المحلية.

وفي أوائل العام المقبل، تخطط الشركة لإصدار BardAdvanced، والذي سيتم تشغيله بواسطة طراز Gemini Ultra الأكثر قوة. تقول Google إنها ستطلق قريبًا برنامجًا تجريبيًا موثوقًا به لتحسين BardAdvanced قبل طرحه على نطاق أوسع للجمهور. وقال سيسي هسياو، نائب رئيس منتجات Bard في Google: "بمباركة Gemini، يخضع Bard لأكبر وأفضل ترقية حتى الآن، مما سيفتح طرقًا جديدة للأشخاص للإبداع والتفاعل والتعاون".