بعد ظهر يوم 29 مايو، اكتشف العديد من مستخدمي الإنترنت أن DeepSeek لديه حد لعدد المرات التي يمكن فيها تجديده وتعديله. بعد التعديل أو التجديد عدة مرات متتالية، ستخبرك الصفحة بأنه تم الوصول إلى الحد الأعلى. أفاد بعض مستخدمي الإنترنت أنه في المحادثات العادية، سيتم الوصول إلى الحد الأعلى بعد التجديد من 3 إلى 6 مرات؛ بينما في وضع الخبير، قد يكون هناك 3 فرص فقط. الحد الأعلى لأوقات إدخال التعديل هو بشكل عام 6 مرات.


في الوقت الحالي، لم يصدر DeepSeek إعلانًا رسميًا، ولم يعلن عن جدول حصص ثابت، لكن هذا الأمر أثار مناقشات ساخنة في المجتمع - بعد كل شيء، لدى DeepSeek عدد كبير من المستخدمين المخلصين، بما فيهم أنا. نواجه أحيانًا خوادم مزدحمة وتعطلًا للصفحات، وهو أمر مفهوم للجميع، لكن لا يمكننا إضافة القيود بصمت، مما يجعل الناس يشعرون بالذعر.

لم تتأثر واجهة برمجة التطبيقات (API) على الإطلاق، لذا فهي على الأرجح مشكلة في البنية التحتية، وهي وصفة مألوفة.


01

الحد الحالي المؤقت في ظل نقص طاقة الحوسبة؟

وفيما يتعلق بهذا القيد، قال "الحساب شبه الرسمي" Baiqiang على Xiaohongshu: لا داعي للذعر، هذا مؤقت.


ووفقا لذلك، تم تقييد "تعديل الرسالة" و"تجديد" فجأة. لم يكن الأمر أن DeepSeek كان يقوم بما يسمى "التحسين السلبي"، بل كان مجرد ذلكالتدابير المؤقتة المتخذة بعد أن أصبح ضغط طاقة الحوسبة كبيرًا جدًا.

نظرًا لتزايد عدد مستخدمي DeepSeek بسرعة خلال هذه الفترة، خاصة بدءًا من بعد ظهر يوم 29 مايو، كان ضغط الطلب على جانب التطبيق واضحًا. من أجل تحديد الأولويات والتأكد من إمكانية استخدام المحادثات النصية الأساسية بشكل طبيعي، يمكن للفريق أولاً تقييد العمليات عالية التردد مثل "تعديل الرسائل" و"تجديد".

على الرغم من أنه في واجهة المستخدم، فإن "التجديد" هو مجرد نقرة زر واحدة، و"تعديل الرسالة" هو مجرد مسألة تغيير السؤال الأصلي. لكن بالنسبة للخادم، فإن هذين الأمرين ليسا تحديثات بسيطة، بل طلب استدلال جديد. في كل مرة ينقر فيها المستخدم للتجديد، يجب على النموذج إعادة معالجة السياق وإنشاء الإجابة. وينطبق الشيء نفسه على تعديل الرسالة. وطالما تغير السؤال الأصلي، يحتاج النموذج إلى الإجابة عليه مرة أخرى بناءً على المدخلات الجديدة.

لذلك، عندما يقوم عدد كبير من المستخدمين بالنقر بشكل متكرر في نفس الوقت والتعامل مع "تجديد" كزر رسم لا نهائي لبطاقة، فإن هذه الطلبات ستصبح ضغطًا كبيرًا على الخادم.

يمكن الاطلاع على هذه المسألة مع بعض التغييرات الأخيرة في DeepSeek. على سبيل المثال، السبب وراء تحميل الملفات في الوضع الخبير وإزالتها من القائمة، وإيقاف تشغيل وظيفة البحث الذكي، و"انشغال الخادم" من وقت لآخر هو في الواقع نقص موارد الحوسبة.لقد أصبح ضغط الخدمة الإجمالي مرتفعًا جدًا لدرجة أنه يجب إجراء مقايضات.


يعد DeepSeek سهل الاستخدام للغاية، لذا تحتاج البنية التحتية الأساسية إلى مواكبة ذلك.

فيما يتعلق بالحالة التي يصل فيها "تعديل الرسالة" أو "تجديد" إلى الحد الأعلى، فإن نصيحة Baiqiang هي عدم النقر بشكل مستمر وبسرعة. يمكنك التوقف أولاً والانتظار لمدة 15 إلى 30 دقيقة قبل المحاولة مرة أخرى. ووفقا للحساب، في معظم الحالات سيتم استعادة القيد تلقائيا بعد الانتظار؛ إذا قمت بالنقر بشكل متكرر وبسرعة، فقد يتعرف النظام عليه على أنه طلب عالي التردد بشكل غير طبيعي، مما يتسبب في زيادة وقت التقييد.

ذكر Bai Qiang أيضًا أنه يتم نشر بطاقات Ascend super Node الجديدة من Huawei ومن المتوقع أن يتم تشغيلها عبر الإنترنت في النصف الثاني من العام. بحلول ذلك الوقت، سيتم توسيع قوة الحوسبة بشكل كبير، ومن المرجح أن يتم رفع هذه القيود المؤقتة.

ومع ذلك، لم يصدر DeepSeek إعلانًا رسميًا حول هذا الأمر حتى الآن. بما في ذلك عدد الحدود ووقت الاسترداد والتغييرات المحددة بعد توسيع قوة الحوسبة في النصف الثاني من العام، ما زلنا بحاجة إلى انتظار مزيد من التأكيد الرسمي.

02

DeepSeek ليس حالة معزولة

في الواقع، DeepSeek ليست أول شركة ذكاء اصطناعي تقوم بذلك.

عندما تكون قوة الحوسبة للمنتجات ذات النماذج الكبيرة محدودة، أو يرتفع عدد المستخدمين، أو يكون الضغط مرتفعًا جدًا خلال فترات الذروة، فإن الممارسات الشائعة هي الحد من التدفق الحالي، أو الرجوع إلى إصدار سابق، أو الانتظار، أو الحد بشكل منفصل من بعض الوظائف عالية الاستهلاك.

كان لدى ChatGPT دائمًا حد للرسائل، وحتى المستخدمين المدفوعين قد يواجهون حدودًا للاستخدام خلال فترات ارتفاع الطلب. بعد وصول المستخدمين المجانيين إلى الحصة النسبية للنموذج المتقدم، سيتم أيضًا تحويلهم إلى نموذج أخف لمواصلة استخدامه.

يمكن فهمه على أنه نوع من "الرجوع إلى إصدار أقدم من الخدمة"، وهذا لا يعني أنه غير مسموح باستخدامه، ولكن لا يمكن للجميع الحصول على استخدام غير محدود للقدرات الأكثر تكلفة والأكثر استهلاكًا للموارد.


كما هو الحال مع Claude، ستقوم Anthropic بتعيين ميزانيات الاستخدام لمستخدمين مختلفين، كما ستقوم السيناريوهات عالية التردد مثل Claude Code وAPI أيضًا بضبط الحد الأعلى وفقًا لتغيرات السعة. عندما تكون قوة الحوسبة وفيرة، يمكن زيادة الحصة؛ وعندما يزداد ضغط الطلب، ستصبح القيود أكثر وضوحا.

في 6 مايو، أصدرت Anthropic أيضًا وثيقة خاصة تفيد بأنه مع التعاون الجديد في مجال الطاقة الحاسوبية وزيادة السعة، فقد تم زيادة حد استخدام Claude Code وClaude API. وهو بدوره يظهر ذلك أيضًايرتبط حد الاستخدام ارتباطًا مباشرًا بقدرة طاقة الحوسبة. سيتم تشديدها عندما تكون قوة الحوسبة ضيقة، وسيتم استرخائها بعد توسيع قوة الحوسبة.


ومع ذلك، وضعت Anthropic الآن حدود استخدام أكثر تفصيلاً لحصص الاشتراك المختلفة، كما تقترب سيناريوهات الاستهلاك العالي مثل Claude Code من منطق قياس الرمز المميز وشحنه.

تعد منتجات إنشاء الصور والفيديو أكثر نموذجية. شهدت وظائف توليد الصور في Sora وGemini، بالإضافة إلى أدوات الفيديو الأخرى التي تعمل بالذكاء الاصطناعي، أوقاتًا من تضييق عدد الأجيال، وأوقات انتظار أطول، وتقليل الحصص المجانية عندما يرتفع الطلب.

ويمكن القول أن "كل استنتاج له تكلفة" أصبح حقيقة لا مفر منها بالنسبة لمنتجات الذكاء الاصطناعي.

منذ بعض الوقت، أثار فرض رسوم على أكياس الفول جولة من النقاش. أصبحت عبارة "Doubao، باهظة الثمن وصعبة الاستخدام" ذات مرة بحثًا ساخنًا على Weibo. إنها مختلفة عن وظائف DeepSeek المقيدة هذه المرة، لكن المنطق وراء ردود فعل المستخدم هو نفسه: الجميع معتاد على أن تكون منتجات الذكاء الاصطناعي رخيصة وسهلة الاستخدام. بمجرد أن تبدأ المنصة في الشحن أو البدء في تقييد وظائف معينة، سوف تنتعش معنويات المستخدم بسهولة.

إنها في الواقع ممارسة شائعة جدًا لشركات الذكاء الاصطناعي لجعل القدرات الأساسية مجانية، والبدء في فرض رسوم على القدرات المعقدة، وتحديد حصص للوظائف عالية التكلفة، والحد من التدفق مؤقتًا خلال فترات الذروة.

يحد DeepSeek من عدد "رسائل التجديد" و"التعديل"، وهو أمر غير معتاد في صناعة الذكاء الاصطناعي بأكملها. ما يقيده ليس مدخل الدردشة أو النموذج نفسه، ولكن فقط تلك العمليات التي يسهل على المستخدمين النقر عليها بشكل متكرر، ولكن كل نقرة ستستهلك موارد التفكير مرة أخرى.

نظرًا لأنه يجب الحفاظ على الحوار الأساسي قدر الإمكان، فهذا هو الحد الأدنى ليتمكن المستخدمون من استخدام المنتج؛ ومع ذلك، فإن وظائف مثل التجديد، والتعديلات المتكررة، وتحميل الملفات، والبحث على الإنترنت، والسياق الطويل، والتوليد متعدد الوسائط، من المرجح أن تكون محدودة أو منخفضة عندما يكون الضغط مرتفعًا.

أشعر أن محور هذا الجدل ليس "كم يجب الحد منه" بل "كيفية الحد منه".

إذا استطاع المسؤول أن يوضح في وقت سابق أن هذا حد تيار مؤقت، والمدة التي سيستغرقها الاستئناف، وما هي العمليات المتأثرة، فمن المرجح أن يكون المستخدمون أكثر قبولًا له.لكن إذا أصبح فجأة غير متاح دون إعلان، فبالطبع سيتساءل الجميع على الفور عما إذا كانت الوظائف تتقلص وما إذا كانت ستكون هناك رسوم في المستقبل.

عندما تتغير منتجات الذكاء الاصطناعي من أدوات متبني مبكر إلى أدوات يومية، سيهتم المستخدمون بشكل متزايد بالاستقرار والشفافية. القيود في حد ذاتها مفهومة، ولكن من الأفضل عدم السماح للمستخدمين بمعرفةها لأول مرة في نافذة منبثقة.

يحتاج DeepSeek إلى معرفة أنه إذا زاد عدد الاستخدامات كثيرًا لدرجة أنه يجب أن يكون محدودًا، فهذا يعني أيضًا أن هناك العديد من المستخدمين في انتظارك.

حتى لو كان مجرد خطاب موافقة.