يمكن استخدام وكيل NVIDIA AI الجديد المبني على نموذج GPT-4 لتدريب مهارات الروبوت المعقدة

أعلنت شركة NVIDIA Research اليوم أنها طورت وكيل ذكاء اصطناعي جديد يسمى "Eureka"، والذي يتم تشغيله بواسطة OpenAI's GPT-4 ويمكنه تعليم الروبوتات المهارات المعقدة بشكل مستقل.

قم بزيارة صفحة الشراء:

ملخص منتجات سلسلة JD.com NVIDIA

وقالت الشركة في تدوينة إن Eureka، التي يمكنها كتابة خوارزميات المكافأة الخاصة بها، هي أول من قام بتدريب يد روبوتية على أداء مهارات سريعة في تحريك القلم مثل البشر. كما قامت يوريكا بتعليم الروبوت ما يقرب من 30 مهمة مثل فتح الأدراج والخزائن، ورمي الكرة والتقاطها، وتشغيل المقص.

وقالت أنيما أناندكومار، المدير الأول لأبحاث الذكاء الاصطناعي في NVIDIA ومؤلفة ورقة Eureka، في منشور بالمدونة: "لقد حقق التعلم المعزز انتصارات مثيرة للإعجاب على مدار العقد الماضي، ولكن لا تزال هناك العديد من التحديات، مثل تصميم المكافآت، الذي لا يزال عبارة عن عملية تجربة وخطأ". "تعد Eureka خطوة أولى في تطوير خوارزميات جديدة تدمج أساليب التعلم التوليدية والمعززة لحل المهام الصعبة."

أصدرت NVIDIA Research أيضًا مكتبة خوارزمية الذكاء الاصطناعي Eureka للأشخاص لإجراء تجارب باستخدام NVIDIA AIsaacGym، وهو تطبيق مرجعي لمحاكاة الفيزياء لأبحاث التعلم المعزز. تم بناء IsaacGym على NVIDIA Omniverse، وهي منصة تطوير لبناء أدوات وتطبيقات ثلاثية الأبعاد تعتمد على إطار عمل OpenUSD.

استمر جنون عملاء الذكاء الاصطناعي منذ أشهر، بما في ذلك ظهور عملاء الذكاء الاصطناعي المستقلين مثل Auto-GPT وBabyAGI وAgentGPT في أبريل من هذا العام.

يعتمد العمل الحالي الذي تقوم به NVIDIA Research على الأعمال السابقة، بما في ذلك Voyager مؤخرًا، وهو وكيل ذكاء اصطناعي تم تصميمه باستخدام GPT-4 والذي يمكنه تشغيل Minecraft بشكل مستقل. نشرت صحيفة نيويورك تايمز هذا الأسبوع مقالًا حول تحويل روبوتات الدردشة إلى وكلاء عبر الإنترنت. وقال جيف كلون، أستاذ علوم الكمبيوتر في جامعة كولومبيا البريطانية والباحث السابق في OpenAI: "هذه فرصة تجارية ضخمة مع القدرة على جلب إيرادات بتريليونات الدولارات. وهذا له جانب إيجابي كبير وتأثير كبير على المجتمع".

في ورقة بحثية جديدة بعنوان "Eureka: تصميم المكافأة على المستوى البشري من خلال تشفير نماذج لغوية كبيرة"، يقول المؤلفون: "تستفيد Eureka من توليد نقطة الصفر الاستثنائية، وكتابة التعليمات البرمجية، وقدرات تحسين السياق الخاصة ببرامج LLM المتطورة مثل GPT-4 لتطوير رمز المكافأة."

يمكن استخدام المكافآت الناتجة لاكتساب مهارات معقدة من خلال التعلم المعزز. "في غياب أي مطالبات خاصة بمهمة محددة أو قوالب مكافآت محددة مسبقًا، تتفوق وظائف المكافأة التي تولدها Eureka على مكافآت الخبراء المصممة بواسطة الإنسان. في مجموعة مكونة من 29 بيئة RL مفتوحة المصدر تحتوي على 10 أشكال مختلفة للروبوتات، تفوقت Eureka على الخبراء البشريين في 83% من المهام، بمتوسط تحسن طبيعي قدره 52%."

قال جيم فان، عالم أبحاث كبير في NVIDIA ومساهم في المشروع، في منشور بالمدونة: "Eureka عبارة عن مزيج فريد من نماذج اللغات الكبيرة وتقنية المحاكاة المتسارعة بواسطة GPU من NVIDIA". "نعتقد أن Eureka ستمكن من التحكم الذكي في الروبوت وتزود الفنانين بطريقة جديدة لإنشاء رسوم متحركة واقعية جسديًا."