إلى جانب نموذج الذكاء الاصطناعي التوليدي Gemini، أصدرت Google هذا الصباح AlphaCode2، وهو نسخة محسنة من توليد التعليمات البرمجية AlphaCode الذي أطلقته Google DeepMind Labs منذ حوالي عام.يتم تشغيل AlphaCode2 فعليًا بواسطة نموذج Gemini، أو على الأقل نسخة منه (GeminiPro) تم ضبطها بدقة بناءً على بيانات المنافسة البرمجية. تقول Google إنه في اختبار مرجعي واحد على الأقل، يتفوق AlphaCode2 على سابقه بكثير.
وفقًا لشركة Google، تفوق أداء AlphaCode2 (المشفر بلغات مثل Python وJava وC++ وGo) بحوالي 85% من المنافسين في المتوسط في مجموعة فرعية من مسابقات البرمجة التي استضافتها Codeforces، وهي منصة منافسة برمجية. وبالمقارنة، كان متوسط درجة الجيل السابق من AlphaCode على نفس المجموعة الفرعية 50% فقط.
"لقد اخترنا 12 مسابقة حديثة تضم أكثر من 8000 مشارك، إما من المجموعة الثانية أو مجموعة "1+2" الأكثر صعوبة. وقد أعطانا هذا إجمالي 77 مشكلة يجب حلها،" كما جاء في التقرير التقني الخاص بـ AlphaCode2. "يستطيع AlphaCode2 حل 43% من المشكلات خلال 10 محاولات، وهو ما يقرب من ضعف سرعة AlphaCode الأصلي (25%).
يستطيع AlphaCode2 فهم مشاكل البرمجة الصعبة التي تتضمن الرياضيات "المعقدة" ونظرية علوم الكمبيوتر. أوضح عالم الأبحاث في DeepMind، ريمي ليبلوند، في مقطع فيديو مسجل مسبقًا أن AlphaCode2 قادر على البرمجة الديناميكية، من بين تقنيات أخرى معقدة إلى حد ما.
لا يعرف AlphaCode2 متى يجب تنفيذ هذه الإستراتيجية بشكل صحيح فحسب، بل يعرف أيضًا مكان استخدامها. وقال ليبلوند إن AlphaCode2 لا يعرف فقط متى يجب تنفيذ هذه الإستراتيجية بشكل صحيح، ولكن أيضًا تحت أي ظروف يجب استخدامها. تجدر الإشارة إلى أن مشاكل البرمجة التي تتطلب برمجة ديناميكية كانت بمثابة حجر عثرة كبير أمام AlphaCode الأصلي.
قال ليبلوند: "يحتاج [AlphaCode2] إلى إظهار مستوى معين من الفهم، ومستوى معين من التفكير وتصميم حل التعليمات البرمجية قبل أن يتمكن من التنفيذ فعليًا، وحل مشكلة الترميز. ويمكنه فعل كل ذلك في مشكلات لم يسبق له مثيل من قبل".
يقوم AlphaCode2 بحل المشكلات من خلال الاستفادة أولاً من مجموعة من "نماذج الإستراتيجية" لإنشاء عدد كبير من عينات التعليمات البرمجية لكل مشكلة. يتم تصفية عينات التعليمات البرمجية التي لا تتناسب مع وصف المشكلة، بينما تقوم خوارزمية التجميع بتجميع "نماذج تعليمات برمجية متشابهة لغويًا" لتجنب أي تكرار. أخيرًا، يختار نموذج التسجيل في AlphaCode2 أفضل مرشح من كل مجموعة من أكبر 10 "مجموعات" من عينات التعليمات البرمجية. هذه هي إجابة AlphaCode2 على السؤال.
الآن، جميع نماذج الذكاء الاصطناعي بها عيوب، وAlphaCode2 ليس استثناءً. وفقًا للورقة البيضاء، يتطلب AlphaCode2 الكثير من التجربة والخطأ، وهو مكلف للغاية بحيث لا يمكن تشغيله على نطاق واسع، ويعتمد بشكل كبير على القدرة على تصفية عينات التعليمات البرمجية السيئة بشكل واضح. ويتوقع التقرير أن الانتقال إلى إصدار أقوى من Gemini، مثل GeminiUltra، قد يخفف من بعض المشكلات.
وقد ألمح إيلي كولينز، نائب رئيس المنتجات في DeepMind، إلى هذا الاحتمال خلال مؤتمر صحفي.
قال كولينز: "أكثر ما يثير اهتمامي بشأن أحدث النتائج هو أنه عندما يتعاون المبرمجون مع [AlphaCode2 المدعوم من Gemini]، يتحسن أداء [النموذج] من خلال تحديد خصائص معينة تلتزم بها التعليمات البرمجية". "في المستقبل، سنرى المبرمجين يستفيدون من نماذج الذكاء الاصطناعي ذات القدرة العالية كأدوات تعاونية للمساعدة في عملية تطوير البرمجيات بأكملها، بدءًا من التفكير حول المشكلات وحتى المساعدة في التنفيذ."