تبشر مبادرة الذكاء الاصطناعي الوطنية في سنغافورة (AISG) بتحول استراتيجي حاسم.في أحدث مشروع نموذجي كبير لها بلغة جنوب شرق آسيا، تخلت AISG عن نموذج Meta واعتمدت بدلاً من ذلك بنية Qwen مفتوحة المصدر الخاصة بشركة علي بابا. ولا يعكس هذا الاختيار إعادة النظر في المسار التقني فحسب، بل يمثل أيضا خطوة مهمة في توسيع النفوذ العالمي لنموذج الذكاء الاصطناعي مفتوح المصدر في الصين.

في 25 نوفمبر، أصدرت AISG نموذج "Qwen-SEA-LION-v4" استنادًا إلى بنية Qwen، والتي تصدرت بسرعة قائمة مفتوحة المصدر تقيس الكفاءة اللغوية في جنوب شرق آسيا. تهدف هذه الخطوة إلى حل مشكلة التكيف اللغوي التي ابتليت بها المنطقة منذ فترة طويلة ——أداء النماذج الغربية مفتوحة المصدر، المتمثلة في سلسلة Meta’s Llama، ضعيف عند التعامل مع اللغات الإقليمية مثل الإندونيسية والتايلاندية والماليزية، مما يحد بشكل خطير من كفاءة تطوير تطبيقات الذكاء الاصطناعي المحلية.

على الرغم من أن اللاما تتمتع بأداء رائد بين النماذج مفتوحة المصدر، إلا أن تصميمها الأساسي "المرتكز على اللغة الإنجليزية" يصعب تغييره بشكل أساسي وهو غير فعال للغاية عند معالجة النصوص غير اللاتينية مثل التايلاندية والبورمية. لقد أدركت AISG تدريجيًا أن الاعتماد على نماذج Silicon Valley مفتوحة المصدر ليس الحل الأمثل لدول جنوب شرق آسيا، ويجب عليها البحث عن النماذج الأساسية التي تتمتع حقًا بقدرات فهم متعددة اللغات، وخاصة سياقات اللغات الآسيوية.


على هذه الخلفية، حولت AISG انتباهها أخيرًا إلى الصين واختارت Qwen3-32B من شركة علي بابا كقاعدة للجيل الجديد من طراز Sea-Lion.

يختلف Qwen3 عن النماذج الغربية، ويستخدم ما يصل إلى 36 تريليون بيانات رمزية في مرحلة ما قبل التدريب، تغطي 119 لغة ولهجة حول العالم.هذه "القدرة المحلية المتعددة اللغات" لا "تتعرف" على الحروف الإندونيسية والماليزية وغيرها من الحروف فحسب، بل تفهم أيضًا بنيتها النحوية من الأسفل، مما يقلل بشكل كبير من العتبة التقنية للتدريب اللاحق لـ AISG.

من أجل التكيف بشكل أفضل مع عادات الكتابة الفريدة للغات جنوب شرق آسيا، يتخلى Qwen-Sea-Lion-v4 عن "رمز الجملة" الشائع الاستخدام في النماذج الغربية ويعتمد بدلاً من ذلك رمزًا مميزًا أكثر تقدمًا لتشفير زوج البايت (BPE). يمكن لهذه التقنية تقسيم الأحرف بدقة أكبر في اللغات بدون مسافات مثل التايلاندية والبورمية، مما يؤدي إلى تحسين دقة الترجمة وسرعة التفكير بشكل كبير.

بالإضافة إلى المزايا التكنولوجية، فإن الاعتبارات العملية للتنفيذ التجاري هي أيضًا مفتاح نجاح علي بابا. يوجد في جنوب شرق آسيا عدد كبير من المؤسسات الصغيرة والمتوسطة الحجم التي لا تستطيع تحمل تكاليف مجموعات وحدات معالجة الرسوميات H100 باهظة الثمن.يمكن تشغيل Qwen-Sea-Lion-v4 المحسّن بسلاسة على أجهزة الكمبيوتر المحمولة المخصصة للمستهلكين والمزودة بذاكرة تبلغ سعتها 32 جيجابايت، مما يسمح للمطورين العاديين بنشر هذا النموذج على المستوى الوطني محليًا. إن ميزة "القدرات على المستوى الصناعي والعتبة على مستوى المستهلك" تناسب بدقة نقطة الألم المتمثلة في موارد الحوسبة الشحيحة في المنطقة.

وهذا التعاون ليس ناتجًا تكنولوجيًا أحادي الاتجاه، بل هو تكامل عميق ثنائي الاتجاه. وبموجب الاتفاقية، توفر علي بابا قاعدة تفكير عالمية قوية، وتساهم AISG في تنظيف 100 مليار من رموز لغة جنوب شرق آسيا. تتجنب هذه البيانات تمامًا مخاطر حقوق الطبع والنشر، ويصل تركيز محتوى جنوب شرق آسيا إلى 13%، وهو ما يعادل 26 ضعف تركيز Llama2.

في قائمة تقييم Sea-Helm، تصدرت Sea-Lion v4 المجهزة بالتكنولوجيا الأساسية لشركة Alibaba قائمة النماذج مفتوحة المصدر ذات الحجم نفسه، مما يؤكد القيمة التقنية والقدرة على التكيف الإقليمي لهذا التعاون الاستراتيجي.