في 19 مارس، أعلنت شركة Xiaomi عن إطلاق ثلاثة نماذج كبيرة مطورة ذاتيًا، وهي Xiaomi MiMo-V2-Pro وXiaomi MiMo-V2-Omni وXiaomi MiMo-V2-TTS. يُذكر أن MiMo-V2-Pro وMiMo-V2-Omni قد افتتحا رسميًا خدمات API.

وفقًا للمقدمة الرسمية لشركة Xiaomi، من بين النماذج الثلاثة، تعد MiMo-V2-Pro هي القاعدة النصية الرئيسية، والتي تم تصميمها لسيناريوهات عمل الوكيل عالية الكثافة وتركز على التفكير والتخطيط واستدعاء الأدوات. MiMo-V2-Omni هي قاعدة وكيل كاملة الوسائط تدمج أصلاً الإدراك النصي والمرئي والصوتي لفتح رابط كامل من الفهم إلى التنفيذ. MiMo-V2-TTS هو نموذج كبير لتركيب الكلام. هدفها هو منح العملاء القدرة على التعبير عن الأصوات الدافئة والعاطفية، وتشكيل الرابط الأخير للمجموعة بأكملها.

باعتباره الطراز الأساسي الرئيسي، تم تحسين MiMo-V2-Pro خصيصًا لسيناريوهات العملاء. فهو ينفذ التعلم المعزز والضبط الدقيق الخاضع للإشراف لبنيات الوكيل المعقدة والمتنوعة، ويتمتع بقدرات أقوى على استدعاء الأدوات والاستدلال متعدد الخطوات، ويحقق النتائج في النهاية. من وجهة نظر معمارية، يتجاوز إجمالي حجم المعلمة للنموذج 1 تريليون (1T)، منها 42B معلمات التنشيط. إنها تعتمد آلية انتباه هجينة محسنة (الانتباه الهجين)، والتي تعمل على تحسين قدرة النموذج بشكل كبير مع ضمان كفاءة التفكير. تم توسيع نافذة السياق الخاصة بها بشكل أكبر إلى مليون رمز، والتي يمكن أن تدعم سلاسل المهام الطويلة جدًا وسير العمل المعقد.

MiMo-V2-Omni وMiMo-V2-TTS، اللذان تم الكشف عنهما في وقت واحد، يكملان قطعتي أحجية الإدراك والتعبير. تكمن القيمة الأساسية للأول في محاذاة الصوت والصور ومقاطع الفيديو. ويدعم الأخير محرك التعبير العاطفي مع التحكم الدقيق، مما يمنح العملاء قدرات التعبير بشكل أقرب إلى البشر.

من حيث التسعير، فإن سعر API الخاص بـ MiMo-V2-Pro أقل من المنتجات المنافسة من نفس المستوى. في سياق 256 ألفًا، يكون سعر الإدخال لكل مليون رمز مميزًا هو 1 دولار أمريكي، والمخرج هو 3 دولارات أمريكية؛ ضمن نطاق السياق 1 مليون، يكون الإدخال 2 دولارًا أمريكيًا، والإخراج هو 6 دولارات أمريكية. حاليًا، افتتحت MiMo-V2-Pro رسميًا خدمات API. قام MiMo-V2-Omni أيضًا بفتح واجهة برمجة التطبيقات (API) الخاصة به ويدعم طول سياق يبلغ 256 كيلو بايت. سعر الإدخال هو 0.4 دولار أمريكي لكل مليون رمز وسعر الإخراج هو 2 دولار أمريكي.


معايير شحن خدمة API لـ MiMo-V2-Pro وClaude

بالإضافة إلى ذلك، تعاونت شركة Xiaomi أيضًا مع فرق إطار عمل الوكلاء الخمسة وهي OpenClaw وOpenCode وKiloCode وBlackbox وCline لتوفير دعم واجهة مجاني محدود لمدة أسبوع واحد لتعزيز تغلغلها في مجتمع المطورين.

ويُنظر إلى هذا أيضًا على أنه إشارة مهمة إلى أن شركة Xiaomi تراهن بشكل كامل على عصر العملاء. في وقت مبكر من ذلك الصباح، نشر مؤسس شركة Xiaomi، لي جون، على منصات التواصل الاجتماعي: "في مجال الذكاء الاصطناعي، سوف يتجاوز استثمارنا في البحث والتطوير ورأس المال هذا العام 16 مليار يوان".


وفقًا لـ Lei Jun، فإن MiMo-V2-Pro، وهو نموذج كبير يحتوي على تريليونات من المعلمات، يحتل المرتبة الثامنة في العالم في تصنيف التحليل الاصطناعي للذكاء الشامل للنموذج العالمي الكبير. تم تصنيفها حسب العلامة التجارية النموذجية الكبيرة، وهي تحتل المرتبة الخامسة في العالم. "لقد تم الانتهاء من نموذجنا للتو وسيتم تكراره وتحسينه بسرعة في الفترة المقبلة."

ومن الجدير بالذكر أن مدير النماذج الكبيرة MiMo من Xiaomi Luo Fuli صرح أيضًا علنًا على منصات التواصل الاجتماعي أن "Hunter Alpha" الذي تم إطلاقه مسبقًا هو نسخة اختبار داخلية للنموذج الرئيسي MiMo-V2-Pro. لوه فولي، المولودة في عام 1995، يطلق عليها اسم "المرأة الموهوبة في مجال الذكاء الاصطناعي" من قبل الصناعة.

في 11 مارس، تم إطلاق النموذج الغامض الذي يحمل الاسم الرمزي "Hunter Alpha" على OpenRouter، أكبر منصة لتجميع واجهات برمجة التطبيقات في العالم. يُذكر أنه في سبعة أيام فقط، تجاوز العدد التراكمي للاستدعاءات لهذا النموذج 1 تريليون رمز، وتصدر القائمة لعدة أيام متتالية، مما تسبب في مناقشات ساخنة وتم الخلط بينه وبين إصدار مبكر من "DeepSeek V4". .

من قبيل الصدفة، عمل لوه فولي ذات مرة في DeepSeek. بدأت حياتها المهنية في أكاديمية Alibaba Damo، حيث قادت تطوير نموذج التدريب المسبق متعدد اللغات VECO وروجت للعمل مفتوح المصدر لشركة AliceMind. في عام 2022، انضم Luo Fuli إلى الشركة الأم لشركة DeepSeek Huanquan Quantitative للمشاركة في العمل المتعلق بالتعلم العميق. عملت لاحقًا كباحثة في مجال التعلم العميق في DeepSeek وشاركت في تطوير DeepSeek-V2 ونماذج أخرى.

في ديسمبر من العام الماضي، ظهرت لوه فولي علنًا لأول مرة في مؤتمر شركاء Xiaomi "النظام البيئي للأشخاص والسيارات والمنازل".

في 17 ديسمبر، أعلن شريك مجموعة Xiaomi ورئيس المجموعة Lu Weibing أن نموذج الذكاء الاصطناعي الكبير الذي طورته شركة Xiaomi Xiaomi MiMo-V2-Flash كان رسميًا مفتوح المصدر وتم إطلاقه. وكشف لو وي بينغ في ذلك الوقت أن شركة Xiaomi أطلقت "استثمار الضغط" في مجال الذكاء الاصطناعي، وأن تقدم النماذج والتطبيقات الكبيرة "تجاوز التوقعات بكثير". وفي المستقبل، سوف يركز على الاتجاه الأساسي المتمثل في "التكامل العميق للذكاء الاصطناعي والعالم المادي".