أجرت SemiAnalogy، وهي منظمة لتحليل الصناعة، مؤخرًا اختبارًا فعليًا على خطط الاشتراك متعددة المستويات لـ OpenAI وAnthropic. وأظهرت النتائج أن هناك فجوة كبيرة في دعم الطاقة الحاسوبية مخفية وراء الرسوم الشهرية المعقولة. اشترت الوكالة خطط اشتراك مختلفة من الشركتين واستمرت في تشغيل المهام الثقيلة مثل البرمجة طويلة المدى و"الوكلاء الأذكياء" حتى وصلت إلى حد الاستخدام الأسبوعي، ثم حسبت التكاليف النظرية المقابلة لهذه الاستخدامات بناءً على أسعار واجهة برمجة التطبيقات العامة.

تظهر نتائج الحساب أنه إذا تم استخدام اشتراك OpenAI "ChatGPT Pro 20x" بسعر 200 دولار أمريكي بالكامل، فإن فواتير واجهة برمجة التطبيقات المقابلة يمكن أن تصل إلى حد أقصى يبلغ حوالي 14000 دولار أمريكي. يمكن أن يصل حل "Claude Max 20x" من Anthropic بنفس السعر إلى تكلفة رمزية نظرية تبلغ حوالي 8000 دولار أمريكي في ظل ظروف الاستخدام القصوى. وهذا يعني أن عددًا صغيرًا من المستخدمين الثقيلين يكفي لاستيعاب هوامش الربح المحدودة في الأصل بموجب نموذج الاشتراك.
وفقًا لتحليل SemiAnalogy، يعد هذا أحد الأسباب التي تجعل الشركات النموذجية الكبيرة تولي اهتمامًا خاصًا لـ "الاستخدام". بالنسبة إلى Anthropic، في مستويات مثل Claude Pro وClaude Max 5x، يمكن للشركة تحقيق التعادل تقريبًا عندما يصل الاستخدام الفعلي للمستخدم إلى حوالي 20%. وبالمقارنة، فإن هوامش ربح OpenAI أقل من ذلك: ففي اشتراكات ChatGPT Plus وChatGPT Pro 5x، بمجرد أن يتجاوز الاستخدام حوالي 11.4%، تبدأ الشركة في خسارة الأموال على هذا المستخدم.
في الخطط العليا ذات الأسعار المرتفعة، يتم تشديد الهيكل الاقتصادي بشكل أكبر. وأشار التقرير إلى أن هامش الربح الإجمالي لشركة Anthropic على الاشتراكات المتطورة كان قريبًا من الصفر عندما وصل معدل الاستخدام إلى حوالي 10%، بينما انخفض OpenAI إلى نطاق إجمالي الربح السلبي عندما كان معدل الاستخدام حوالي 5.7%. بمعنى آخر، لا يحتاج المستخدمون إلى الوصول إلى تردد استخدام كثيف للغاية حتى تتغير هذه الاشتراكات من "منتجات مربحة" إلى "منتجات محققة للخسارة".
وفي هذا السياق، أصبحت كيفية ضبط الأسعار أو تقييد الوصول إليها مشكلة صعبة بالنسبة للمصنعين. يعد نموذج الاشتراك برسوم شهرية ثابتة عاملاً رئيسيًا في الشعبية السريعة لمنتجات مثل ChatGPT وClaude. وبمجرد تشديد الحصص أو رفع العتبات، قد يضعف زخم نمو المستخدم. في "سباق التسلح" النموذجي واسع النطاق الحالي، لا تزال قدرة النموذج وتوافره من أهم الرقائق التنافسية، مما يجعل من الصعب على الشركات تعديل استراتيجياتها بسهولة.
ومن ناحية أخرى، فإن التغييرات في كيفية استخدام الذكاء الاصطناعي فعليًا تؤدي أيضًا إلى زيادة ضغوط التكلفة. وأشار التقرير إلى أن استهلاك الرمز المميز لسير العمل الجديد الذي تمثله أنظمة "الوكيل" متعددة الخطوات التي تستدعي الأدوات بشكل مستقل يمكن أن يصل إلى ألف مرة مقارنة بالمحادثات التقليدية ذات الجولة الواحدة. وقد أجبر نمط الاتصال عالي الكثافة هذا بعض الشركات الكبيرة على إعادة النظر في الانفتاح الداخلي واستراتيجيات التحكم في التكاليف لأدوات الذكاء الاصطناعي.
وفقًا للتقارير، قامت شركات مثل Microsoft وMeta وAmazon بتقليص ممارساتها السابقة المتمثلة في تشجيع الموظفين على إجراء تجارب واسعة النطاق وترقيات داخلية بسبب التوسع السريع في الفواتير الداخلية. وفي إحدى الحالات التي حظيت بتغطية إعلامية واسعة النطاق، أنفقت إحدى الشركات مبلغ 500 مليون دولار على خدمات أنثروبك في شهر واحد فقط دون وضع أي قيود على استخدام الموظفين لكلود، مما أدى بشكل مباشر إلى تدخل إدارة الطوارئ.

تحت ضغط التكلفة والطلب الفعلي، بدأت المزيد والمزيد من المؤسسات في اعتماد استراتيجيات توجيه نموذجية أكثر دقة. يتلخص أحد الأساليب في تسليم المشكلات المعقدة ذات القيمة العالية إلى "النماذج الحدودية" باهظة الثمن (النماذج الحدودية)، مع تفويض العمل المكتبي الروتيني، ومهام الأسئلة والأجوبة الأساسية إلى نماذج أرخص. من خلال تفريغ المهام بهذه الطريقة، يمكن لبعض الشركات خفض تكاليف الذكاء الاصطناعي الإجمالية بنسبة تصل إلى 95%، حسبما نقلت صحيفة وول ستريت جورنال عن بحث. وأشار فيشال ميسرا، العميد المساعد لجامعة كولومبيا، إلى أن الشركات لا تحتاج دائمًا إلى نماذج كبيرة عالية المستوى "تفهم الجاذبية الكمية". تعد العديد من النماذج مفتوحة المصدر كافية للاحتياجات اليومية، مما سيضغط أيضًا على المساحة المتميزة للنماذج المغلقة باهظة الثمن.
قامت بعض الشركات الناشئة في مجال الذكاء الاصطناعي بعمليات هجرات أكثر جذرية. قال فلو كريفيلو، المؤسس والرئيس التنفيذي لشركة Lindy الناشئة لمساعد الذكاء الاصطناعي، إن الشركة حولت 100% من حركة المرور الخاصة بها إلى DeepSeek V4، لتبتعد تمامًا عن النموذج الأنثروبي. في تقييمهم، كان DeepSeek V4 مشابهًا من حيث القدرات لـ Claude Sonnet بجزء بسيط من التكلفة، وهي عملية نقل أفادت التقارير أنها وفرت للشركة ملايين الدولارات.
ويختار آخرون بناء أنظمتهم الخاصة بناءً على نماذج مفتوحة المصدر، والجمع بين البيانات الداخلية والبنية التحتية الخاصة بهم مقابل هيكل تكلفة طويل المدى أكثر قابلية للتحكم. على الرغم من أن هذا المسار يتطلب استثمارًا أوليًا أعلى، إلا أنه يساعد في تقليل الاعتماد على موردي الذكاء الاصطناعي السحابي التابعين لجهات خارجية ويسمح للمؤسسات بالتحكم بشكل أكبر في تكاليف الاستدلال وأمن البيانات وتحسين الأداء. وفي سيناريوهات رأسية محددة، قد تتفوق النماذج الداخلية التي تم ضبطها بدقة على النماذج المتطورة ذات الأغراض العامة.
على المدى المتوسط إلى الطويل، تتوقع الصناعة عمومًا أن تنخفض بعض التكاليف تدريجيًا مع توسع البنية التحتية، وتطور الأجهزة، وتكرار النماذج. وتتوقع شركة SemiAnalys أنه مع مستوى القدرة المتوسط إلى العالي الذي يمثله Opus 4.8 الحالي، من المتوقع أن يتم توفيره بشكل مربح بسعر حوالي 20 دولارًا أمريكيًا شهريًا من خلال تكنولوجيا أكثر نضجًا وقوة حوسبة أكثر كفاءة في المستقبل. لكن هذا الحكم لا ينطبق على أحدث نماذج الطبقة العليا، والتي ستظل مرتفعة في تكاليف التشغيل في المستقبل المنظور ومن المرجح أن يتم تحصيلها من خلال فواتير واجهة برمجة التطبيقات (API)، وفتح الميزات المتدرجة، وما إلى ذلك، بدلاً من تجميعها ببساطة في خطة اشتراك موحدة للجماهير.
وحتى ذلك الحين، لا يزال مقدمو خدمات الذكاء الاصطناعي بحاجة إلى تحقيق توازن صعب بين اتجاهين: من ناحية، يرغب المستخدمون في الحصول على أقوى قدرات الذكاء الاصطناعي الممكنة مقابل رسوم شهرية منخفضة ويمكن التنبؤ بها؛ ومن ناحية أخرى، لا تزال قوة الحوسبة الأساسية والبنية التحتية التي تدعم هذه القدرات باهظة الثمن وحساسة للغاية لكثافة الاستخدام. كما اعترف سام ألتمان، الرئيس التنفيذي لشركة OpenAI، علنًا بأن تكلفة الرمز المميز أصبحت مشكلة خطيرة بشكل متزايد، وتعمل الشركة جاهدة لتحسين المنتجات والهندسة المعمارية للسماح للمستخدمين بتحقيق "قيمة أكبر بنفقات أقل" عند استخدام ChatGPT.