تطلق Google عائلة نماذج ترجمة مفتوحة المصدر جديدة TranslateGemma

أصدرت Google اليوم عائلة جديدة من نماذج الترجمة مفتوحة المصدر، TranslateGemma، استنادًا إلى أحدث نموذج وزن مفتوح المصدر Gemma 3، والذي يُطلق عليه رسميًا "خطوة مهمة في فتح مجال الترجمة". تدعم الدفعة الأولى ما يصل إلى 55 لغة، وتغطي اللغات السائدة مثل الإسبانية والفرنسية والصينية والهندية.

توقيت هذا الإصدار يتبع بشكل وثيق ديناميكيات المنافسين: قبل بضع ساعات فقط، أطلقت OpenAI للتو أداة الترجمة ChatGPT، التي تركز على التحكم في النغمة والسياق. ومن خلال واجهة ذات عمودين والتعرف التلقائي على اللغة، تحاول هذه الخدمة تحدي خدمات الترجمة التقليدية مثل خدمة الترجمة من Google من حيث تجربة المستخدم وفهم السياق. في المقابل، تركز TranslateGemma بشكل أكبر على قدرات النموذج المفتوح وجودة الترجمة الشاملة على معايير متعددة.

تتوفر عائلة TranslateGemma حاليًا بثلاثة أحجام: 4 مليار، و12 مليار، و27 مليار معلمة. تظهر نتائج التقييم التي قدمتها Google أنه وفقًا لمعيار WMT24++، تفوق TranslateGemma 12B على الإصدار الأساسي من Gemma 3 27B، مما يعني أنه مع أقل من نصف عدد المعلمات، يمكنه تحقيق إنتاجية أعلى وزمن وصول أقل، مع الحفاظ على دقة الترجمة أو حتى تحسينها، وهو أمر مفيد للمطورين في نشر نماذج ترجمة عالية الجودة في بيئات ذات قوة حوسبة محدودة.

فيما يتعلق بسيناريوهات النشر، قالت جوجل إن نموذج 4B مُحسّن لاستدلال الهاتف المحمول وهو مناسب للتشغيل محليًا على الأجهزة الطرفية مثل الهواتف المحمولة؛ نموذج 12B موجه لسيناريوهات قوة الحوسبة المحلية مثل أجهزة الكمبيوتر المحمولة الاستهلاكية؛ ويتطلب الطراز 27B دعمًا أقوى لطاقة الحوسبة، مثل البطاقة السحابية الواحدة NVIDIA H100 والتكوينات الأخرى. وفي اختبار ترجمة الصور Vistra، حققت TranslateGemma أيضًا نتائج أفضل في مهمة ترجمة النص داخل الصورة، على الرغم من أنه لم يتم ضبطها بشكل محدد لهذا السيناريو، مما يدل على إمكانات النموذج لفهم النص متعدد الوسائط.

كشفت Google أن تحسين أداء TranslateGemma يأتي من عملية تدريب مكونة من مرحلتين. يتم الإشراف على المرحلة الأولى من الضبط الدقيق. قدم فريق البحث كمية كبيرة من مجموعة الترجمة البشرية بالإضافة إلى النموذج الأساسي جيما 3 ودمجها مع البيانات التركيبية عالية الجودة الناتجة عن نموذج جيميني للتدريب. تستخدم المرحلة الثانية التعلم المعزز لتوجيه تحسين جودة الترجمة من خلال مجموعة من نماذج المكافآت، بما في ذلك MetricX-QE وAutoMQM وغيرها من المؤشرات المتقدمة، مما يجعل النموذج أكثر طبيعية وملاءمًا للسياق لمخرجات الترجمة.

تتوفر حاليًا المجموعة الكاملة من نماذج TranslateGemma للتنزيل على منصتي Kaggle وHugging Face للباحثين والمطورين للتجربة والتطوير بحرية. وفي حين تعمل شركة OpenAI على دمج الترجمة في المنتجات الأمامية القائمة على الدردشة، توفر Google المزيد من الخيارات التقنية لإنشاء تطبيقات الطرف الثالث من خلال فتح نماذج أساسية عالية الأداء، مما يشير أيضًا إلى أن مسار الترجمة الآلية سيكثف المنافسة على مستويي النماذج المفتوحة والأدوات الموجهة نحو الخدمة.

مقالات ذات صلة:

ترجمة ChatGPT متاحة عبر الإنترنت: تطلق OpenAI جولة جديدة من التحديات لترجمة Google