أصدرت شركة DeepL، وهي شركة تعمل بالذكاء الاصطناعي وتشتهر بأدوات ترجمة النصوص الخاصة بها، اليوم مجموعة منتجات ترجمة الكلام إلى كلام لدخول سوق ترجمة الكلام في الوقت الفعلي، والتي تغطي مجموعة متنوعة من السيناريوهات مثل الاجتماعات عبر الإنترنت، ومحادثات الهاتف المحمول والويب، والتواصل الجماعي الذي يشمل موظفي الخطوط الأمامية من خلال تطبيقات مخصصة. وفي الوقت نفسه، أطلقت DeepL أيضًا واجهة برمجة التطبيقات (API) للمطورين والمؤسسات لدعم حلول الترجمة الصوتية المخصصة لمراكز الاتصال والشركات الأخرى بناءً على تقنيتها.

قال جاريك كوتيلوفسكي، الرئيس التنفيذي لشركة DeepL، في مقابلة إنه بعد سنوات من التركيز على ترجمة النصوص، أصبح الكلام "الخطوة الطبيعية التالية" للشركة. وأكد أن شركة DeepL قطعت شوطًا طويلًا في ترجمة النصوص والمستندات، ولكن في مجال ترجمة الكلام في الوقت الفعلي، "لا يزال هناك نقص في منتج متميز حقًا"، ولهذا السبب قررت الشركة الدخول.

وأشار كوتلوفسكي إلى أن الصعوبة الأساسية في بناء منتج ترجمة في الوقت الفعلي هي كيفية تحقيق التوازن بين تقليل زمن الوصول والحفاظ على الدقة. يشير ما يسمى بالتأخير إلى الفارق الزمني بين وقت تحدث المستخدم ووقت تشغيل الصوت المترجم. في سيناريوهات المؤتمر والحوار، كلما كان الفرق أصغر، كلما كانت تجربة اتصال المستخدم أقرب إلى "الحوار المتزامن".

في هذا الإصدار، تطلق DeepL مكونات إضافية لـ Zoom وMicrosoft Teams، مما يسمح للمستمعين في الاجتماعات عن بعد بالاستماع إلى جميع الأطراف التي تتحدث بلغاتها الأصلية، أو سماع الأصوات المترجمة في الوقت الفعلي، أو قراءة الترجمات المترجمة في الوقت الفعلي على الشاشة. لا يزال البرنامج في مرحلة الاختبار المبكر، وتدعو DeepL الشركات للانضمام إلى قائمة الانتظار لتكون أول من يجرب هذه الميزة. بالإضافة إلى ذلك، توفر الشركة أيضًا منتجات محادثة للمحطات المتنقلة وصفحات الويب، مما يسمح للمستخدمين بالتواصل عبر اللغات شخصيًا أو عن بُعد.

بالنسبة لسيناريوهات المجموعة متعددة الأشخاص دون الاتصال بالإنترنت أو عبر الإنترنت مثل التدريب والندوات، يسمح DeepL للمشاركين بالانضمام إلى نفس الجلسة عن طريق مسح رمز الاستجابة السريعة، ويمكن للجميع تلقي المحتوى المترجم باللغة المقابلة على أجهزتهم الخاصة. قالت DeepL إن تقنية تحويل الكلام إلى كلام يمكنها أيضًا تعلم وتكييف المفردات المخصصة، مثل مصطلحات الصناعة الرأسية، وأسماء الشركات، والأسماء الشخصية، لتحسين استخدامها في السيناريوهات المهنية.

ويعتقد كوتلوفسكي أن الذكاء الاصطناعي سيعيد تشكيل شكل صناعة خدمة العملاء في السنوات القليلة المقبلة. يمكن لطبقة الترجمة عالية الجودة أن تساعد الشركات على الاستمرار في تقديم دعم خدمات متعدد اللغات في سوق تفتقر فيه إلى المواهب اللغوية المحلية وترتفع فيه تكاليف التوظيف. وبموجب هذه الرؤية، تأمل DeepL ألا تخدم تقنيتها الصوتية سيناريوهات المؤتمرات فحسب، بل ستصبح أيضًا إحدى البنى التحتية اللغوية الأساسية لمراكز خدمة العملاء والمؤسسات العالمية.

فيما يتعلق بخريطة الطريق التقنية، قالت DeepL إن منتجاتها الحالية مدفوعة بمجموعة تقنية "تحويل الكلام إلى كلام" الكاملة ذاتية التطوير، ولكنها في هذه المرحلة لا تزال تستخدم عملية مكونة من ثلاث خطوات "تحويل الكلام إلى نص - ترجمة النص - تحويل النص إلى كلام". وتعتقد الشركة أن تركيزها على المدى الطويل على ترجمة النصوص يمنحها ميزة في جودة الترجمة الشاملة. للمضي قدمًا، تخطط DeepL لتطوير نموذج ترجمة الكلام الشامل الذي يتجاهل الخطوات الوسيطة للنص من أجل تحقيق المزيد من التحسينات في زمن الوصول والطبيعية.

في مجال الكلام والترجمة، تواجه شركة DeepL منافسة من شركات ناشئة متعددة. ومن بينها، جمعت ساناس 65 مليون دولار أمريكي من شركتي Quadrille Capital وTeleperformance العام الماضي. وهو يركز على التكنولوجيا التي تعمل على تعديل لهجة المتحدثين في الوقت الفعلي، وذلك بشكل أساسي لعملاء مركز الاتصال. توفر شركة Camb.AI، التي يقع مقرها الرئيسي في دبي، خدمات تركيب الكلام والترجمة لشركات الإعلام والترفيه، مما يساعد العملاء على استكمال الدبلجة وتوطين المحتوى واسع النطاق. تقوم شركة Palabra، التي استثمرها صندوق Seven Seven Six التابع لمؤسس موقع Reddit، Alexis Ohanian، ببناء محرك لترجمة الكلام في الوقت الفعلي يركز على محاولة الاحتفاظ بالخصائص الصوتية الأصلية للمتحدث أثناء عملية الترجمة، مما يشكل علاقة تنافسية أكثر مباشرة مع القدرات التي تبنيها شركة DeepL.

بعد إنشاء موطئ قدم لها في سوق ترجمة النصوص، تحاول DeepL توسيع حدودها من خلال المنتجات الصوتية، وتوسيع نطاق التكنولوجيا لتشمل التعاون في المؤتمرات وخدمة العملاء وسيناريوهات العمليات في الخطوط الأمامية. مع سعي المزيد من الشركات إلى استخدام الذكاء الاصطناعي لتقليل تكاليف الاتصال بين اللغات، من المتوقع أن تصبح ترجمة الكلام في الوقت الفعلي محور جولة جديدة من المنافسة، وتعمل شركة DeepL على تسريع نشرها على هذا المسار.