وبعد استعراض مهاراته في الطهي، أصدر الروبوت الذي طوره فريق ستانفورد الصيني فيديو جديد بعنوان "يوم في حياة موبايل ألوها" في وقت مبكر من صباح اليوم بتوقيت بكين، يظهر العشرات من مهارات الأعمال المنزلية مثل سقي الزهور، وتنظيف الغرفة، وإعداد القهوة، وحلاقة صاحبها، وغسل الأطباق، واللعب مع القطط، ورمي القمامة، وغسل الملابس، وتغيير أغطية اللحاف، وتخزين الملابس. يمكن أن يطلق عليه "مدبرة المنزل الشاملة".






وعلق مستخدمو الإنترنت قائلا: "الشيء الأكثر ندرة هو أن هناك حياة في العيون".

لطالما انزعج الناس من "مفارقة مورافيك"، وهي ظاهرة غير بديهية مفادها أن "المهام التي يجدها البشر سهلة تكون صعبة للغاية بالنسبة للذكاء الاصطناعي، والعكس صحيح".

وبعبارة أخرى، فإن الروبوت الذي يمكنه القيام بالأعمال المنزلية نادر جدًا.

لكن لا تكن سعيدًا جدًا. على الرغم من أن MobileALOHA لديه "عيون حية"، إلا أن البشر لا يزالون يتحكمون في حركاته (انظر الصورة أدناه)، وهي ليست عملية مستقلة ذكية تمامًا.


وقال أحد قادة الفريق إن التحكم البشري مؤقت، وهم يدرسون بالفعل كيفية سد الفجوة بين التحكم البشري والتحكم الذاتي للروبوت. وقال توني ز. تشاو، قائد آخر في الفريق، متفائلاً: "سيكون عام 2024 عام الروبوت، وهذا (روبوت التدبير المنزلي) هو مجرد البداية!"

تكمن الأهمية الكبرى لـ MobileALOHA في أن قدرات التحكم في الحركة لديها أقوى من الأنظمة المماثلة التي تكلف 5 إلى 10 مرات أكثر، مما يدل على جدوى الروبوتات العالمية. قد يصل قريبًا روبوت منزلي رخيص الثمن وسهل الاستخدام.

ALOHA، نظام أجهزة مفتوح المصدر منخفض التكلفة للتشغيل عن بعد ثنائي اليدين، هو نظام أجهزة تشغيل للتحكم عن بعد ثنائي المصدر مفتوح المصدر ومنخفض التكلفة، أي ذراع آلية مفتوحة المصدر. تستخدم خوارزمية ActionChunkingwithTransformers (ACT) نموذج الشبكة العصبية Transformers، لذا فهي تتمتع بقدرات التعلم المقلدة. في 15 دقيقة فقط من العرض التوضيحي، يمكن للذراع الروبوتية أن تتعلم إجراء ما - حيث تقوم بالتعلم التقليد الشامل مباشرة من العروض التوضيحية الحقيقية ويتم جمعها من خلال واجهة تشغيل مخصصة عن بعد.

وفقًا للفريق الصيني المذكور أعلاه، يمكن لـ MobileALOHA إكمال العديد من المهام المعقدة من خلال 50 عرضًا توضيحيًا فقط. وتبلغ التكلفة 32 ألف دولار أمريكي فقط (حوالي 220 ألف يوان)، والبرمجيات والأجهزة كلها مفتوحة المصدر.

قدم الفريق تكوين أجهزة MobileALOHA بالتفصيل في الورقة - أغلىها هي الذراع الروبوتية وقاعدة الهاتف المحمول، حيث تعد قاعدة الهاتف المحمول رخيصة نسبيًا بين المنتجات المماثلة؛ تم تجهيز المستشعر بكاميرتين للمعصم وكاميرا علوية واحدة؛ مجهزة بإمدادات الطاقة والحسابات على متن الطائرة، أي بطارية 1.26 كيلووات ساعة تزن 14 كجم. تم إجراء جميع الحسابات أثناء جمع البيانات والاستدلال على جهاز كمبيوتر محمول من فئة المستهلك مزود بوحدة معالجة الرسومات Nvidia 3070ti (ذاكرة VRAM سعة 8 جيجابايت) وIntel i7-12800H.


الأجزاء ذات القيمة العالية في فاتورة المواد

جيم فان، "باحث مشاهير الإنترنت" في Nvidia والمتدرب الأول في OpenAI، توقع سابقًا بتفاؤل أن عام 2024 سيكون العام الأول الذي ينهض فيه مجتمع الذكاء الاصطناعي بشكل كامل لمواجهة مفارقة مورافيك. "لن نفوز على الفور، لكننا سنكون على طريق النصر".

هذه ليست مجرد لحظة من الإثارة. تظهر التطورات المختلفة في الصناعة في تيار لا نهاية له. سرد جيم تطوير النماذج والمنصات الأساسية للروبوتات المستقبلية في عام 2023:

1. نماذج كبيرة متعددة الوسائط تستخدم أذرعًا آلية كأجهزة إدخال/إخراج مادية: VIMA، وPerAct، وRvT (NVIDIA)، وRT-1، وRT-2، وPaLM-E (Google)، وRoboCat (DeepMind)، وOcto (Berkeley، Stanford، CMU)، وما إلى ذلك؛

2. الخوارزميات التي تسد الفجوة بين System1 (المسؤول عن التحكم منخفض المستوى) والنظام 2 (المسؤول عن الاستدلال عالي المستوى) (تمكين النظام من استخدام الاستدلال عالي المستوى لاتخاذ القرارات وفهم هذه القرارات وتحويلها إلى عمليات وتحكم فعلي): Eureka (NVIDIA)، CodeasPolicies (Google)، وما إلى ذلك؛

3. تقدم مذهل في الأجهزة القوية: Tesla Optimus Prime، وFiger، و1X، وApptronik، وSanctuary، وAgility+Amazon، وUnitree، وما إلى ذلك؛

4. لقد كانت البيانات دائمًا بمثابة كعب أخيل للروبوتات. يخطط مجتمع البحث بشكل مشترك لـ ImageNet التالي (مشروع رئيسي لتحقيق اختراقات في التعلم العميق للذكاء الاصطناعي)، مثل فتح مجموعة بيانات OpenX-Embodiment (RT-X). وعلى الرغم من أن مجموعة البيانات ليست متنوعة بما فيه الكفاية بعد، إلا أنها خطوة مهمة؛

5. ستلعب المحاكاة والبيانات الاصطناعية دورًا رئيسيًا في حل مهارة الروبوت وحتى مشاكل رؤية الكمبيوتر ككل؛

يتم وضع الأساس خطوة بخطوة. في بداية عام 2024، لدينا سبب للتطلع إلى الظهور الأول المذهل للروبوتات الأكثر قوة.