انسحبت شركة Manus مؤخرًا من السوق الصينية، وأزالت محتوى حسابها الاجتماعي المحلي، وانتقلت إلى الأسواق الخارجية بكل قوتها. وكان التفسير الرسمي هو أن السبب يعتمد بشكل أساسي على تعديل كفاءة التشغيل والتخطيط الدولي. في 19 يوليو، بتوقيت بكين، نشر جي ييتشاو، المؤسس المشارك لشركة Manus، مدونة تقنية، تستجيب لأول مرة من منظور تقني، وتلخص الخبرات والدروس المستفادة في Agent R&D والتدريب منذ تأسيس الشركة.

من منظور تقني، قال جي ييتشاو إن مانوس سيركز على هندسة السياق وسيحقق تكرارًا سريعًا للمنتج بمساعدة "الذاكرة" الهيكلية والعمليات. يتضمن بشكل أساسي الرهان على السياق، ولم يعد نماذج التدريب، مع التركيز على أهمية معدل ضربات KV-Cache (ذاكرة التخزين المؤقت ذات القيمة الرئيسية، آلية التخزين المؤقت)، وليس إضافة الأدوات ديناميكيًا، واستخدام نظام الملفات لاستضافة السياق المستمر. جوهر الأمر هو توفير تكلفة التدريب للنموذج الأساسي والتركيز على تحسين كفاءة التدريب.
في النماذج الكبيرة، يشير السياق عادةً إلى مجموعة المعلومات التي يشير إليها النموذج عند معالجة المهام أو إنشاء محتوى الإخراج. يمكن أن يساعد النموذج على تحسين فهمه وتحسين أداء المهام وتعزيز تماسك المخرجات. في السابق، أكد مؤسس Dark Side of the Moon Kimi Yang Zhilin على أهمية السياق في المقابلة. وقال إن القيمة النهائية لمنتجات Ai-native (نموذج المنتج المحدد بواسطة الذكاء الاصطناعي) هي توفير تفاعل شخصي، والسياق الطويل بدون فقدان (LosslessLongContext) هو المفتاح لتحقيق هذا الهدف. ورأى أن الضبط الدقيق للنموذج لا ينبغي أن يكون موجودًا على المدى الطويل. يعد سجل التفاعل بين المستخدم والنموذج أفضل عملية تخصيص، ويمكن لتقنية السياق الطويل تسجيل واستخدام تواريخ التفاعل هذه بشكل أفضل.
بالإضافة إلى ذلك، يعد معدل ضربات KV-Cache أمرًا بالغ الأهمية، ويرجع ذلك أساسًا إلى أن معدل الضرب المرتفع يمكن أن يحسن كفاءة الاستدلال، وتحسين استخدام الموارد، وتقليل تكاليف الحوسبة. بناءً على ذلك، يُطلق على KV-Cache غالبًا اسم جوهر الكفاءة لمرحلة الاستدلال لنموذج المحول.
يعد اختيار تحسين كفاءة التدريب من الجوانب المذكورة أعلاه بدلاً من البدء من النموذج الأساسي درسًا تعلمته Ji Yiguo على مر السنين. وقال إنه عندما بدأ شركته الأخيرة (Peak Labs)، قرر الفريق تدريب نماذج لاستخراج المعلومات المفتوحة والبحث الدلالي من الصفر، ولكن بعد ذلك بوقت قصير، ظهر نموذج OpenAI's GPT-3 ونموذج Flan-T5 من Google، وأصبحت النماذج الداخلية التي طورها الفريق من الصفر غير ذات صلة بين عشية وضحاها. "ومن المفارقات أن هذه النماذج تمثل بداية التعلم السياقي وطريقة جديدة للمضي قدمًا." قال جي ييتشاو.
استنادًا إلى الدروس السابقة، بعد بدء Manus، لم يعد الفريق يستثمر في بحث وتطوير النماذج الأساسية، ولكنه اختار بين استخدام النماذج الأساسية مفتوحة المصدر لتدريب الوكلاء الشاملين، وبناء الوكلاء استنادًا إلى قدرات تعلم السياق للنماذج المتطورة. على الرغم من أن الدروس المستفادة من Peak Labs جعلت فريق Manus يدرك أهمية السياق، إلا أن الأمر لم يكن سهلاً. استغرق الأمر أربعة تعديلات على إطار عمل الوكيل لتحقيق الحل الأمثل المحلي.
ومع ذلك، تجدر الإشارة إلى أن هذه الإستراتيجية لا تزال تعاني من قيود، خاصة عند مواجهة ChatGPT Agent الذي أصدرته OpenAI للتو. السبب الأساسي هو أن ChatGPT Agent يعتمد على نموذج OpenAI المخصص ويعتمد التدريب الشامل، والذي يمكنه التعامل بشكل أفضل مع المهام المعقدة. على الرغم من أن Manus يمكنه تحسين الكفاءة، إلا أنه لا يزال يعتمد على مجموعة خارجية متعددة النماذج والتحسين الهندسي، وهو أقل قليلاً من حيث اتساق تنفيذ المهام ودقته.
بالإضافة إلى ذلك، عندما دخلت شركة Manus السوق الدولية، جلبت OpenAI صناعة الوكلاء إلى نقطة انعطاف بفضل مزايا النموذج الأساسية، مما أدى إلى جذب المزيد من المطورين والمستخدمين إلى منصات الشركات المصنعة الكبرى. على الرغم من أن الشركات الناشئة لديها مجال للبقاء في المجالات الرأسية، إلا أنها لا تزال تواجه حتمًا تحدي التنافس على حصة السوق. خاصة عندما تواجه منتجات الوكلاء حاليًا صعوبات مثل التجانس الخطير، ونماذج الأعمال غير الواضحة، والتكاليف المرتفعة، فإن النقاط البارزة في الهندسة السياقية والجوانب الأخرى ليست كافية للشركات الناشئة لتبرز. لا يزال الفريق بحاجة إلى مواصلة تحسين الاستراتيجيات التقنية واستكشاف مسارات تطوير مختلفة.