تطلق OpenAI حلاً جديدًا لخفض تكاليف الاستدلال بشكل مباشر في half

في أخبار لم يتم الكشف عنها مسبقًا، كشف مهندسو OpenAI لبعض زملائهم الداخليين في وقت سابق من هذا الشهر أنه من خلال سلسلة من التحسينات التقنية الجديدة، وجدوا طريقةيتم تقليل تكاليف تشغيل الاستدلال النموذجي بأكثر من النصفيخطط.

تم الإبلاغ عن أن openai قد عثر على طريقة لخفض تكاليف الاستدلال في v0-7vqlfnnfrgah1.webp

بعد أن طبق المهندسون هذه التقنية الجديدة على سيناريو ChatGPT حيث تمكن الزائرون الذين لم يسجلوا حسابًا مجانيًا/مدفوعًا من الوصول إلى ChatGPT، كانت قوة الحوسبة لبطاقات الرسومات NVIDIA المطلوبة خلال فترات الذروة بضع مئات من اليوانات فقط. وكان هذا الرقم أقل من المتوقع. (بالطبع، قامت OpenAI بتعيين حد لتكرار المكالمات لهذا النوع من الزوار المجهولين، والاستخدام العام لـ ChatGPT من قبل هذه المجموعة ليس مرتفعًا.)

في الوقت الحاضر، لم تكشف OpenAI عن التفاصيل الفنية المحددة المستخدمة لتحسين الكفاءة هذا. تتكهن الصناعة بأن طرق التحسين شائعة الاستخدام تشمل: القياس الكمي للنموذج، والتخزين المؤقت للقيمة الرئيسية (السماح للنموذج بتذكر معلومات الحساب السابقة وتجنب العمليات المتكررة)، وطلب معالجة الدفعات (الرد على استعلامات المستخدم على دفعات بدلاً من معالجتها واحدة تلو الأخرى)، وجدولة الطلبات لنماذج خفيفة الوزن منخفضة الطاقة أو وحدات نموذجية فرعية لإكمال الاستجابات، وما إلى ذلك.

ومع ذلك، عندما تطلق OpenAI نموذج جيل جديد بمعلمات أكبر في وقت لاحق من هذا العام، قد يضعف تأثير خفض التكلفة الناتج عن هذه الدفعة من تقنيات التحسين، لأن تكلفة تشغيل نموذج المعلمة الكبير نفسه ستكون أعلى بكثير.

يسمى هذا النوع من تقنية تحسين الاستدلالتكنولوجيا مضاعفة الطاقة الحاسوبية، وهو أيضًا محور مختبرات الذكاء الاصطناعي الكبرى. ذكر الرئيس التنفيذي لشركة Anthropic Dario Amodei هذا المفهوم علنًا في المدونات الصوتية منذ منتصف عام 2023 على الأقل. وقال في ذلك الوقت إن الشركة حددت بشكل صارم نطاق الموظفين الداخليين الذين يعرفون مجموعة واحدة من حلول تحسين طاقة الحوسبة. وبمجرد نسخ التكنولوجيا ذات الصلة من قبل أقرانها، فإن ذلك سيمنح مختبرات الذكاء الاصطناعي الأخرى ميزة تنافسية. (يمكن أن تشير تقنية مضاعفة قوة الحوسبة أيضًا إلى طرق مختلفة لتحسين الكفاءة في مرحلة التدريب النموذجي.)

أصبحت أهمية هذا النوع من تكنولوجيا التحسين بارزة بشكل متزايد. في الوقت الحالي، تواجه الشركات الرائدة في مجال البحث والتطوير في مجال الذكاء الاصطناعي عمومًا نقصًا في قوة حوسبة الخادم. حتى لو قامت الشركة بتوقيع عقد لبناء مركز بيانات جديد أو استئجاره، فغالبًا ما يستغرق الأمر أشهرًا أو حتى سنوات من بداية المشروع حتى الإطلاق الرسمي. (تعمل OpenAI أيضًا مع Broadcom للتطوير الذاتي لرقائق خاصة لتشغيل النماذج الكبيرة، في محاولة لتقليل تكاليف الاستدلال بشكل أكبر، بهدف تحقيق تخفيضات في التكلفة مقارنة برقائق Nvidia التجارية.)

بعد تنفيذ تحسين تكنولوجيا OpenAI، يولي السوق أيضًا اهتمامًا كبيرًا لكيفية تعامل الشركات مع تكاليف طاقة الحوسبة المحفوظة. فمن ناحية، يمكن لـ OpenAI تمرير الأرباح إلى المستخدمين: إما زيادة حد مكالمات ChatGPT للمشتركين الذين يدفعون رسومًا، أو خفض أسعار الواجهات النموذجية المفتوحة للمطورين. في الوقت الحاضر، انخفض سعر الاتصال للإصدار القديم من النموذج إلى جزء صغير من السعر الأصلي، ويعد تحسين الاستدلال أحد الأسباب الأساسية.

سيؤدي ذلك إلى تعزيز مكانة OpenAI في السوق كمزود خدمة نموذجي فعال من حيث التكلفة. في الآونة الأخيرة، كان المنتج المنافس Anthropic مثيرًا للجدل بسبب ارتفاع أسعار النماذج - على الرغم من أن تأثير مخرجات النموذج أفضل.

من ناحية أخرى، يمكن لـ OpenAI أيضًا اختيار استخدام دخل خفض التكلفة لزيادة هامش الربح الإجمالي، في حين يتم تحديد هامش الربح الإجمالي للشركة بشكل أساسي من خلال تكلفة قوة الحوسبة الاستدلالية. بلغ هامش الربح الإجمالي لشركة OpenAI في الربع الأول من هذا العام 39٪، بزيادة من 33٪ في نفس الفترة من العام الماضي، ولكن لا تزال هناك فجوة كبيرة من هامش الربح الإجمالي المستهدف البالغ 52٪ في نهاية العام.

لتحقيق هدفها السنوي، تحتاج الشركة إلى تحقيق متوسط هامش إجمالي قدره 56٪ لبقية العام. ارتفعت إيرادات أنثروبيك بشكل حاد في النصف الأول من هذا العام، ومن المتوقع أن تحقق أرباحًا غير متوقعة في هذا الربع، مما يؤكد تمامًا سرعة تحسن هامش الربح الإجمالي خلال دورة ازدهار الصناعة.

في هذه المرحلة، ليس لدى OpenAI رأي مطلق في التسعير، ولكن تقنية تحسين الاستدلال هذه ستوسع بشكل كبير مسارها لتحسين هامش الربح الإجمالي.