وبحسب تقارير إعلامية،تعمل OpenAI على تطوير نموذج حديث جديد مصمم لجعل محادثات المستخدمين مع ChatGPT أكثر طبيعية وسلاسة. يتمثل الاختراق الأساسي لهذه التقنية في أنه عندما يقاطع المستخدم النظام أثناء تحدث الذكاء الاصطناعي، يمكن للذكاء الاصطناعي ضبط الاستجابة في الوقت الفعلي بدلاً من التوقف فجأة كما هو الحال الآن.

حاليًا، يستخدم الوضع الصوتي المتقدم لـ ChatGPT آلية الحوار القائمة على الأدوار. يجب على المستخدم إنهاء التحدث قبل أن يقوم الذكاء الاصطناعي بمعالجة الصوت وإنشاء إجابة. إذا أدخل المستخدم استجابة قصيرة مثل "حسنًا" أو "mm-hm" عندما يتحدث الذكاء الاصطناعي، فعادةً ما يتوقف النظام مباشرة ولا يمكنه مواصلة الاتصال مثل المحادثة العادية.

لحل هذه المشكلة،يقوم BiDi (نموذج الكلام ثنائي الاتجاه) الذي تم تطويره بواسطة OpenAI بمعالجة مدخلات كلام المتحدث بشكل مستمر، حتى يتمكن من ضبط استجابته على الفور عند مقاطعته.في المقابل، بمجرد أن تبدأ نماذج الكلام الحالية في توليد الإجابات، يتم إصلاح محتوى الإخراج بشكل أساسي ولا يمكن تغييره بناءً على المدخلات الجديدة.

هذه التكنولوجيا لا تزال في مرحلة التطوير. وفقًا لأشخاص مطلعين على الأمر، كان النموذج الأولي عرضة لمواطن الخلل وأحيانًا يصدر أصواتًا غير طبيعية بعد عدة دقائق من المحادثة المستمرة. كان باحثو OpenAI يأملون في الأصل في إطلاق BiDi في الربع الأول من هذا العام، ولكن قد يتم تأجيل الإصدار الأخير إلى الربع الثاني أو في وقت لاحق.

تعتقد OpenAI أنه إذا كان نموذج الكلام قادرًا على الاقتراب من نموذج النص في الأداء، فسيتم توسيع نطاق استخدام الذكاء الاصطناعي بشكل أكبر، لأن معظم الناس معتادون أكثر على التواصل الصوتي مع الذكاء الاصطناعي بدلاً من إدخال النص. قد يكون نموذج BiDi ذا قيمة خاصة في سيناريوهات خدمة العملاء.

على سبيل المثال، عندما يتحدث أحد العملاء إلى خدمة عملاء الذكاء الاصطناعي لمتاجر التجزئة، إذا قرر العميل مؤقتًا استبدال المنتج بدلاً من إعادته أثناء المحادثة، فيمكن لنموذج BiDi نظريًا أن يسمح لخدمة عملاء الذكاء الاصطناعي بضبط المحادثة بسلاسة دون توقف مفاجئ أو ارتباك.

كشف الأشخاص المطلعون على الأمر أيضًا أن نموذج BiDi أكثر مرونة أيضًا في استدعاء الأدوات والتطبيقات الخارجية.ذكرت OpenAI سابقًا أن الشركة تخطط لتحسين النموذج الصوتي لجهاز الذكاء الاصطناعي المستقبلي الذي يتفاعل بشكل أساسي من خلال الصوت، وتدرس تطوير مكبر صوت ذكي يمكنه التحقق من رسائل البريد الإلكتروني أو حجز الخدمات من خلال الأوامر الصوتية.