إذا كان بإمكانك تلخيص الوتيرة الحالية لدائرة النماذج الكبيرة للذكاء الاصطناعي في كلمة واحدة، فلن تكون "سرعة DeepSeek" أكثر ملاءمة. بعد أقل من خمسة أيام من إصدار النسخة النصية فقط من V4، نظم المسؤول "ثلاث جولات من الانخفاضات المتتالية في الأسعار" في الأسعار. قبل أن تتمكن الصناعة من التعافي، كانت الورقة الرابحة التالية قد ظهرت بالفعل - محرك V4 "الكامل" المزود بقدرات متعددة الوسائط، والذي دخل رسميًا في العد التنازلي للإصدار.

كشف الباحث الأساسي شخصيًا: القدرة البصرية الأصلية قادمة
نشر Chen Xiaokang، وهو عضو أساسي في فريق DeepSeek متعدد الوسائط، مؤخرًا مقالًا على منصة X، معلنًا بوضوح أن "الإصدار الجديد من DeepSeek V4" قادم. وبدمجها مع السياق الحالي، فمن المؤكد تقريبًا أن هذه "النسخة الجديدة" هي النسخة متعددة الوسائط التي طال انتظارها.

منذ إطلاق V4، تشير أكبر المناقشات الساخنة في الصناعة وأثر الندم إلى نفس الشيء: تم إطلاق نموذجين فقط للنص فقط، فلاش (سريع) وبرو (خبير)، في الموجة الأولى. من المؤكد أن إمكانات النص الخالص هي الأساس، ولكن في ساحة النماذج الكبيرة اليوم، كانت "تعدد الوسائط الأصلية" منذ فترة طويلة هي تذكرة الوصول إلى المستويات العليا. بدون الفهم البصري للصور ومقاطع الفيديو، سيتم قفل الحد الأعلى للنموذج في المشاهد الحقيقية المعقدة بإحكام. يعد إطلاق الإصدار متعدد الوسائط هذه المرة خطوة أساسية لـ DeepSeek لتعويض النقص الأخير.

لقد كان التطبيق ينذر منذ فترة طويلة: الأمر لا يتعلق بنقاط التشغيل، بل يتعلق بـ "القدرة على تحمل التكاليف"


اكتشف المستخدمون الحريصون أنه بعد التحديث الأخير لعميل DeepSeek، أضاف شريط تحديد النموذج بهدوء ثلاثة خيارات مستقلة: "سريع" و"خبير" و"مرئي". يتوافق الأولان مع V4's Flash وPro، ومن الواضح أن الخيار "Visual"، الذي كان في حالة "سيتم تفعيله"، هو واجهة مخصصة للإصدار الجديد القادم من V4 متعدد الوسائط.

أما بالنسبة إلى ما هي المرتبة التي يمكن أن يصل إليها هذا الطراز V4 متعدد الوسائط من حيث القوة الصلبة؟ لا توجد بيانات محددة متاحة حتى الآن. ومع ذلك، وبالإشارة إلى الأداء المهيمن لـ V4 Pro في مجال النص العادي، تتوقع الصناعة بشكل عام أن قدراتها المرئية ستكون على الأقل ثابتة في المستوى الأول - ومع ذلك، لم يكن هذا هو ما يهتم به DeepSeek أكثر من أي وقت مضى.

الورقة الرابحة الحقيقية: "خفض" سعر الوسائط المتعددة
بالنسبة إلى DeepSeek، الذي سلك دائمًا مسارًا غير تقليدي، فإن الاندفاع الأعمى إلى التصنيف ليس هو الهدف الأساسي. "إن خفض أسعار النماذج الكبيرة المتعددة الوسائط إلى أسعار الملفوف حتى يتمكن المطورون والمستخدمون العاديون من تحمل تكاليفها حقًا" هو ورقتها الرابحة الحقيقية. تذكر أن V4 نظم "ثلاث جولات من تخفيضات الأسعار" بعد خمسة أيام فقط من صدوره. إذا تم أيضًا تخفيض تكلفة مكالمات واجهة برمجة التطبيقات (API) متعددة الوسائط اللاحقة إلى السعر الأدنى، فسيكون التعديل الوزاري في الصناعة أكثر كثافة بكثير من حرب الأسعار في حقل النص العادي.

لتلخيص ذلك في جملة واحدة: إن وصول الإصدار V4 متعدد الوسائط ليس مجرد قدرة تكميلية، ولكنه أيضًا نقطة انطلاق لـ DeepSeek لقلب جدول أسعار المسار متعدد الوسائط.