في 26 فبراير، في اليوم الثالث من أسبوع المصدر المفتوح، أعلنت DeepSeek عن افتتاح مكتبة DeepGEMM الفعالة FP8GEMM. ترتبط جميع إصدارات DeepSeek في الأيام الثلاثة الماضية بالخوارزميات وهي أكثر تقنية.

أعطى تشين ران، مؤسس المجتمع البيئي النموذجي الكبير OpenCSG (التعبير المفتوح)، مثالاً لصحيفة تشاينا بيزنس نيوز، "في الماضي، أعطت DeepSeek سيارة مباشرة وأخبرت الجميع أن السيارة يبلغ مداها 900 كيلومتر، ولكن الآن تقوم DeepSeek بالبحث بشكل أعمق لمعرفة كيف يمكن أن تصل إلى 900 كيلومتر." لماذا يمكن لنموذج DeepSeek تحقيق نتائج أفضل، هناك بعض الخوارزميات والأطر المقابلة، والمصدر المفتوح لهذه "السقالات" يفضي إلى البناء البيئي في المستقبل.


بالنسبة للكلمات الرئيسية التي تم إصدارها هذه المرة، تعد GEMM (ضرب المصفوفات العامة) عملية أساسية في الجبر الخطي، في حين أن FP8GEMM هي عملية حسابية تستخدم أرقام الفاصلة العائمة ذات 8 بت لضرب المصفوفات. FP8 هو تنسيق النقطة العائمة منخفض الدقة ومناسب للتعلم العميق والحوسبة عالية الأداء. يمكنه تقليل استخدام الذاكرة ومتطلبات النطاق الترددي مع الحفاظ على كفاءة الحوسبة العالية.

وفقًا لـ DeepSeek، يدعم DeepGEMM كلا من النماذج الكثيفة التقليدية وعمليات GEMM لنماذج MoE (الخبير المختلط). يوفر هذا الرمز تدريبًا فعالاً ودعمًا للاستدلال لأجهزة سلسلة V3/R1 المستندة إلى بنية NVIDIA Hopper (مثل H100GPU).

ذكر DeepSeek أنه بناءً على قاعدة التعليمات البرمجية هذه، يمكن تحقيق أداء 1350 + FP8TFLOPS (عمليات الفاصلة العائمة في الثانية) على وحدة معالجة الرسومات NVIDIA Hopper، مما يحقق الاستفادة الكاملة من قوة الحوسبة. في الوقت نفسه، يعد تصميم قاعدة التعليمات البرمجية بسيطًا للغاية، مع وظيفة نواة أساسية واحدة فقط وحجم رمز يبلغ حوالي 300 سطر، ولكنه يتفوق على النوى المضبوطة بواسطة الخبراء في معظم أحجام المصفوفات.

ما هو تأثير DeepGEMM مفتوح المصدر؟ طرح المراسل هذا السؤال على DeepSeek، فأجاب بأن DeepGEMM قام بحل نقاط الضعف المتعلقة بكفاءة الحوسبة ذات النماذج الكبيرة واستهلاك الموارد من خلال FP8 وتحسين مستوى الأجهزة، وقدم بشكل خاص دعمًا رئيسيًا لتنفيذ نموذج MoE. إن سلوكها مفتوح المصدر لا يؤدي إلى تسريع عملية إضفاء الطابع الديمقراطي على التكنولوجيا فحسب، بل قد يصبح أيضًا "البنية التحتية" للنظام البيئي لحوسبة الذكاء الاصطناعي ويعزز تطوير الصناعة في اتجاه أكثر كفاءة ومنخفضة التكلفة.

FP8 هو معيار ناشئ لحوسبة الذكاء الاصطناعي. يمكن لكفاءتها العالية تسريع تدريب مئات المليارات من نماذج المعلمات وتقليل متطلبات ذاكرة الفيديو. عند نشرها على الأجهزة الطرفية أو في السحابة، يمكن لحسابات FP8 منخفضة الدقة تحسين الإنتاجية بشكل كبير وتقليل التكاليف. لذلك، يمكن لـ DeepGEMM مفتوح المصدر تعزيز تعميم بيئة FP8، وخفض عتبة استخدام المطورين، وتعزيز المزيد من الأطر والنماذج للتكيف مع FP8، وتسريع انتقال الصناعة إلى الحوسبة منخفضة الدقة.

بالإضافة إلى ذلك، يصعب تنفيذ نماذج وزارة التربية والتعليم بسبب التعقيد الحسابي. يوفر المصدر المفتوح لـ DeepGEMM مرجعًا فعالاً للتنفيذ، مما قد يؤدي إلى المزيد من تطبيقات وزارة التعليم (مثل النماذج متعددة الوسائط، والنماذج الفعالة من جانب الحافة).

وفيما يتعلق بقاعدة الأكواد مفتوحة المصدر لـ DeepSeek لمدة ثلاثة أيام متتالية، قال تشين ران للصحفيين: "لقد صدمنا للغاية بها". الهدف النهائي لـ DeepSeek هو إظهار كيفية تصنيع R1 وV3. وهو يعتقد أن الخوارزميات التي أصدرتها DeepSeek حاليًا هي "سقالات" إلى حد ما. "يجب علينا أن نعطي الجميع "سقالات" حتى يتمكن الجميع من الاستمرار في استخدام خط التكنولوجيا القائم على DeepSeek، وفي نهاية المطاف يمكن للصناعة بناء نظام بيئي يعتمد على ذلك."

على المدى الطويل، يعتقد تشين ران أن مبادرة DeepSeek مفتوحة المصدر ذات معنى كبير. فهو يحتوي على معايير نموذجية، ومعايير أدوات، وأحجار زاوية بيئية، حتى يتمكن النظام البيئي من النمو.

رأى تشين ران أن كود DeepSeek مفتوح المصدر قد يؤثر على مجموعة من الممارسين الذين يعملون على طبقة AIInfra. "يوفر DeepSeek بشكل أساسي مجموعة التكنولوجيا والنماذج، لكنه يفتقر إلى البيانات، ولكن قد يقوم الآخرون أيضًا بإعادة إنتاج البيانات. وسيتعين على الأشخاص في طبقة AIInfra العثور على اتجاهات جديدة." لكنه قال أيضًا إن هذا النوع من المصادر المفتوحة هو سيف ذو حدين. إذا كان بإمكانك الاستفادة بشكل جيد من محتوى DeepSeek مفتوح المصدر، فقد تستفيد أيضًا. "إذا لم تستخدمه بشكل جيد، فسوف تتعرض للضرب".

كما أخبر بعض الممارسين المراسلين أن مصدر DeepSeek المفتوح هو تسريع الاستدلال لطبقة الأشعة تحت الحمراء. سيكون للمصدر المفتوح لتقنية DeepSeek الأساسية تأثير على الممارسين، لكنه قد لا يكون كبيرًا جدًا.

"لقد بدأ للتو تأثير DeepSeek على الصناعة، ولا يمكن لأحد أن يخمن النتيجة." قال الممارس المذكور أعلاه.

أعلنت شركة DeepSeek سابقًا أنها ستفتح 5 مكتبات أكواد برمجية واحدة تلو الأخرى. بعد ذلك، سيصدر DeepSeek مكتبتين إضافيتين للأكواد هذا الأسبوع. "سيصبح كل سطر من التعليمات البرمجية المشتركة دافعًا جماعيًا لتسريع تطوير صناعة الذكاء الاصطناعي." وقال DeepSeek في الإعلان.