الطبيعة: نموذج DeepMind الضخم يخترق مسائل رياضية عمرها 60 عامًا والحل يتجاوز الإدراك البشري

باستخدام نماذج كبيرة لحل المشكلات التي أزعجت علماء الرياضيات لأكثر من 60 عامًا، نُشرت أحدث نتائج Google DeepMind في مجلة Nature.وقال بوشميت كوهلي، أحد المؤلفين ونائب رئيس الأبحاث في Google DeepMind:لن يكون هذا المخطط موجودًا في بيانات التدريب، ولن يكون معروفًا للبشر من قبل.

تسمى هذه التقنية FunSearch، حيث Fun هو اختصار للوظيفة.

الاستفادة من النماذج الكبيرة لحل التحديات العلمية طويلة الأمد، وتوليد معلومات جديدة يمكن التحقق منها وقيمة* لم تكن موجودة من قبل.

وفي التقرير الإخباري المصاحب لمجلة Nature، ذكر الشخص المسؤول عن DeepMind أن "الطريقة التي نستخدم بها النماذج الكبيرة هي بمثابة محرك للإبداع".

هذه هي المرة الأولى التي يُظهر فيها أي شخص أن الأنظمة المبنية على نماذج كبيرة يمكن أن تتجاوز إدراك علماء الرياضيات وعلماء الكمبيوتر.

إنها ليست جديدة فحسب، بل إنها أكثر فعالية من أي شيء آخر موجود اليوم.

وتعليقاً على هذا الإنجاز قال بعض مستخدمي الإنترنت:

وإذا كان هذا صحيحا، فهو أهم اكتشاف للبشرية منذ الحريق.

إذًا، ما هي المشكلات التي يحلها FunSearch؟

ابحث عن حلول أفضل لمشاكل NP-hard

يوضح DeepMind على وجه التحديد نوعين من المشاكل، وكلاهما مشاكل NP-hard.

وفقًا للمجتمع الأكاديمي، لا توجد، وربما لا توجد أبدًا، خوارزمية يمكنها إيجاد حلول دقيقة لمشاكل NP الصعبة في زمن كثير الحدود في جميع الظروف.

في مواجهة مثل هذه المشاكل، يبحث الباحثون عادة عن حلول تقريبية أو خوارزميات فعالة مناسبة لمواقف محددة.

خاص بـ FunSearch، النوع الأول من مشاكل NP-hard الذي يحله هو مشكلة Capset، وهي نوع من مشاكل تعيين الحد الأعلى. وصفه هو كما يلي:

هناك نقاط n متساوية البعد في كل بعد من الفضاء ذو الأبعاد n (n^n إجمالاً، على سبيل المثال، 3 أبعاد هي 3*3*3). ابحث عن أكبر عدد ممكن من النقاط لتكوين مجموعة. يشترط ألا تكون أي 3 نقاط في المجموعة على خط واحد. كم عدد النقاط الموجودة على الأكثر في هذه المجموعة؟

إذا بدا الأمر صعبًا بعض الشيء على الفهم، فقد تتعلم أيضًا عن اللعبة السابقة لمشكلة Capset، وهي لعبة ورق اخترعتها عالمة الوراثة مارشا فالكو في السبعينيات.

يوجد إجمالي 81 بطاقة في لعبة الورق هذه. تحتوي كل بطاقة على 1 إلى 3 أنماط ألوان. الألوان والأشكال والظلال للأنماط الموجودة في نفس البطاقة هي نفسها تمامًا.

يحتوي هذا السطح على 3 ألوان و3 أشكال و3 ظلال. بما في ذلك عدد الأنماط، يوجد إجمالي 3*3*3*3=81 بطاقة. يحتاج اللاعبون إلى تسليم بعض البطاقات للعثور على المجموعة الخاصة المكونة من 3 بطاقات.

إذا تم التعبير عن الطريقة المحددة لهذه "التركيبة الخاصة" في شكل هندسي منفصل، فسنحصل على مشكلة Capset.

وُلدت مسألة كابسيت أيضًا في السبعينيات، والتي اقترحها عالم الرياضيات في جامعة أكسفورد رون جراهام، لكن النتائج المهمة الأولى لم تظهر حتى التسعينيات.

في عام 2007، ذكر تيرينس تاو في تدوينة أن هذه هي مسألته الرياضية المفتوحة المفضلة.

قبل ظهور FunSearch، تم اقتراح أهم اختراق في مسألة Capset من قبل عالم الرياضيات الأمريكي جوردان إلينبرغ وعالم الرياضيات الهولندي ديون جيجسويت في عام 2016.

من خلال طريقة كثيرات الحدود، قام إلينبيرج وجيجسويجت بتقليل الحد الأعلى لحل هذا النوع من المسائل إلى 2.756^n عندما تكون n>6 (يمكن العثور على الحد الأقصى للمجموعة بدقة عندما تكون n≥6).

أيضًا عندما يكون n>6، فإن الرقم الأحدث للحد الأدنى هو 2.218^n، الذي اقترحه فريد تيريل، طالب دكتوراه في جامعة بريستول في عام 2022.

لكن هذا الحد الأدنى موجود فقط من الناحية النظرية - عندما يكون n=8، هناك 496 نقطة فقط في أكبر مجموعة يمكن للبشر تكوينها، ووفقًا لاستنتاج تيريل، يجب ألا يقل عدد النقاط عن 585.7.

قامت FunSearch بتوسيع حجم المجموعة إلى 512 نقطة - على الرغم من أنه لا تزال هناك فجوة مع القيمة النظرية، إلا أنها لا تزال تعتبر الإنجاز الأكثر أهمية في هذه القضية منذ 20 عامًا.

في الوقت نفسه، تم أيضًا رفع الحد الأدنى لحجم مجموعة Capset إلى 2.2202^n بواسطة FunSearch.

الفئة الثانية هي مشاكل الملاكمة عبر الإنترنت:

لنفترض أن هناك مجموعة من الحاويات القياسية بسعة C وتسلسل n من العناصر (حجم العناصر لا يتجاوز C). تصل هذه العناصر بترتيب معين.

"متصل" يعني أن المشغل لا يمكنه رؤية جميع العناصر مقدمًا، ولكن يجب أن يقرر على الفور الحاوية التي سيتم تحميل العناصر فيها عند وصولها.

الهدف النهائي هو إبقاء عدد الحاويات المستخدمة صغيرًا قدر الإمكان.

لقد اجتذبت مشكلة التجميع عبر الإنترنت بحثًا مكثفًا منذ السبعينيات، ويمكن إرجاع أقدمها إلى مشكلة التخطيط التي درسها غاوس في عام 1831.

بعد ما يقرب من 200 عام من البحث، لا توجد حتى الآن نظرية ناضجة وطريقة حسابية رقمية فعالة.

تشتمل الخوارزميات الجشعة شائعة الاستخدام تقليديًا على FirstFit وBestFit:

يعني FirstFit وضع كل عنصر في المربع الأول الذي يمكنه استيعابه. تضع BestFit كل عنصر في الصندوق الذي يمكنه استيعابه ولديها أصغر مساحة متبقية في الصندوق.

اقترحت FunSearch خوارزمية جديدة، مما أدى إلى تقليل عدد الحاويات المستخدمة في كل من مجموعات بيانات اختبار OR وWeibull بشكل كبير.

خاصة عندما يصل عدد العناصر في مجموعة الاختبار إلى 100000، فإن الحل الذي توصلت إليه FunSearch يستهلك حاويات أكثر بنسبة 0.03% فقط من الحد الأدنى النظري.

(البيانات الموجودة في الجدول أدناه تمثل الفرق عن الحد الأدنى النظري. كلما كان الرقم أصغر، كان الأداء أفضل)

إذًا، كيف يتم تطبيق FunSearch؟

ابحث عن "البرنامج" بدلاً من "الإجابات"

على العموم، يعد سير عمل FunSearch عملية تكرارية، وجوهرها هو البحث عن البرامج التي يمكنها حل المشكلة، بدلاً من البحث عن إجابة السؤال نفسه.

البحث هو بالضبط ما استكشفته DeepMind منذ AlphaGo.

أوضح المؤسس المشارك Shane Legg ذات مرة في إحدى المقابلات:

من أين أتى مفتاح "الخطوة 37" في هزيمة AlphaGo لـ Lee Sedol؟ ليس من بيانات اللعب البشري، ولكن من البحث في مساحة الاحتمالات.

النماذج الكبيرة الحالية تحاكي فقط بيانات التدريب المختلفة وتخلطها. لتوليد إبداع حقيقي وتجاوز البنية الحالية، يجب دمجه مع البحث.

وبالعودة إلى الإنجاز الأخير FunSearch، هناك مكتبة برامج في النظام. في كل تكرار، سيقوم النظام بالبحث عن البرنامج الأولي وإدخال النموذج الكبير (يتم استخدام PaLM2 للتجربة، كما أن الرموز الأخرى متوافقة أيضًا طالما أنها تدعمه).

ويتم بناء النموذج الكبير على هذا الأساس لتوليد برامج جديدة وتسليمها لنظام التقييم الآلي. سيتم إضافة البرنامج الحاصل على أعلى الدرجات إلى مكتبة البرنامج، وبالتالي تحقيق التداول الذاتي.

ومن بينها، يقوم نظام التقييم بإنشاء حالات اختبار بناءً على أسئلة المستخدم ثم يحدد ما إذا كانت مخرجات البرنامج المرشح صحيحة.

اعتمادًا على التعقيد، تتضمن طرق تحديد الصحة الفحص المباشر لقيمة المخرجات أو استدعاء الوظائف ذات الصلة.

وفي الوقت نفسه، تم تجهيز نظام التقييم أيضًا بمنطق التسامح مع الأخطاء لتجنب المهلة وغيرها من المشكلات التي تؤثر على العملية بأكملها.

وأخيرًا، سيعطي النظام درجة إجمالية بناءً على سلوك البرنامج المرشح في حالات الاختبار هذه، مما يوفر أساسًا لتوليد النتائج وتحديثات مكتبة البرنامج اللاحقة.

ويعتقد جوردان إلينبرغ من جامعة ويسكونسن ماديسون، المؤلف المشارك للورقة البحثية، أن إحدى السمات المهمة لبرنامج FunSearch هي أنه يمكن للأشخاص رؤية الحلول الناجحة التي يولدها الذكاء الاصطناعي والتعلم منها، وهو أمر يختلف تمامًا عن نموذج الصندوق الأسود السابق للذكاء الاصطناعي.

والأمر الأكثر إثارة بالنسبة لي هو بناء نماذج جديدة للتعاون بين الإنسان والآلة، والتي آمل أن أستخدمها ليس كبديل لعلماء الرياضيات من البشر، بل كمضاعف للقوة.