وفي منتدى تنغتشونغ العلمي لعام 2025، قدم وانغ شينغ شينغ، مؤسس شركة يوشو للتكنولوجيا، شرحا متعمقا للمنطق "المجسم" والتحديات العملية التي تقف وراء تطوير الروبوتات البشرية.قال وانغ شينغ شينغ: "الناس يحبون الروبوتات التي تشبه البشر". والحقيقة هي أنه كلما كانت الروبوتات ذات مظهر أفضل وأشبه بالبشر، كلما زاد استعداد المستهلكين لدفع ثمنها.

وذكر أيضًا أن تقنية الذكاء الاصطناعي الحالية تعتمد بشكل كبير على البيانات، وأن جودة البيانات تحدد بشكل مباشر الحد الأعلى لقدرات الذكاء الاصطناعي. وبقدر ما يتعلق الأمر بالروبوتات البشرية، لا تزال بيانات العمل والسلوك عالية الجودة وواسعة النطاق نادرة.

أظهر وانغ شينغ شينغ للمشاركين التقدم الذي أحرزته تكنولوجيا يوشو في هذا المجال:من خلال جمع بيانات حركة الشخص الحقيقي مسبقًا والتدريب في بيئة الذكاء الاصطناعي، يمكن للروبوتات إعادة إنتاج الحركات المتنوعة للبشر، وإدراك أن "الروبوتات تتحرك كما يتحرك البشر".

واعترف وانغ شينغ شينغ أيضًا بأن نماذج الذكاء الاصطناعي الحالية في مجال الذكاء المتجسد لا تزال غير كافية. "المرحلة الحالية مشابهة للحالة التي كانت موجودة قبل ظهور ChatGPT بفترة تتراوح من سنة إلى ثلاث سنوات - الاتجاه واضح، لكن نتائج الاختراق لم يتم الكشف عنها بالكامل بعد."

هو يعتقد،إذا تمكن الروبوت من إكمال حوالي 80% من المهام من خلال اللغة أو التعليمات النصية في 80% من المشاهد غير المألوفة في الحياة اليومية، فيمكن اعتبار ذلك بمثابة "لحظة GPT" في مجال الذكاء المتجسد.في الوقت الحاضر، تؤدي الروبوتات أداءً جيدًا في مهمة واحدة، ولكن بمجرد تغير الكائن أو البيئة، خاصة عند مواجهة تراكب مهام متعددة، سينخفض ​​معدل النجاح بشكل كبير، مما يعكس عيوب الروبوت في قدرات التعميم والاستدلال.

أخيرًا، كشف وانغ شينغ شينغ: "ربما لا يتعين علي أن أكون حاضرًا في منتدى علماء تنغتشونغ العام المقبل شخصيًا. يمكنني إرسال روبوت لحضور الاجتماع نيابة عني. يمكنني التحكم فيه عن بعد من مدينة هانغتشو والسماح له بمزامنة لغتي وحركاتي لتحقيق التفاعل في الوقت الفعلي. هذه التكنولوجيا ممكنة بالفعل ومن المتوقع أن يتم وضعها موضع التنفيذ العملي في العام المقبل."