على الرغم من أن مرافق أجهزة DeepSeek لم تنشر تفاصيل، فمن المعتقد بشكل عام أنه يتم استخدام عدد كبير من شرائح NVIDIA AI، بما في ذلك H100 وH800 وH20 ونماذج مختلفة أخرى. ومع ذلك، وفقًا لأحدث ما تم الكشف عنه، فقد تحقق DeepSeek أيضًا من أحدث شريحة AI من Huawei - Ascend 910C.
تم الكشف عن Ascend 910C في وقت لاحق من عام 2024. ويقال أنه تم توفيره على دفعات لبعض العملاء، بما في ذلك Alibaba وBaidu وTencent. تتكون الدفعة الأولى من حوالي 70 ألف وحدة، بمتوسط حوالي 20 ألف يوان فقط لكل منها.
تظهر الرسالة،يتم تصنيع Ascend 910C باستخدام عملية 7 نانومتر الخاصة بشركة SMIC، مع عبوة متكاملة ثنائية الشريحة. ويصل عدد الترانزستورات إلى 53 ملياراً، كما وصلت نسبة التوطين الإجمالية إلى حوالي 55%.
يمكن أن يحل محل NVIDIA H100 ويستخدم أيضًا للتدريب والاستدلال على الذكاء الاصطناعي على نطاق واسع. إنه يعمل بشكل جيد تحت أنواع البيانات المختلفة مثل FP8، FP16، FP32، وFP64.
وبحسب البيان الأخير،تُظهر البيانات المقاسة من فريق DeepSeek أن أداء Ascend 910C من Huawei يعمل بشكل جيد بشكل غير متوقع في استدلال الذكاء الاصطناعي، حيث يصل إلى حوالي 60% من أداء شريحة NVIDIA H100.
بالإضافة إلى،من خلال نواة CUNN المكتوبة بخط اليد والتحسين، يمكن تحسين أداء Ascend 910C بشكل أكبر.
ويقال ذلكيدعم DeepSeek شرائح Huawei Ascend منذ اليوم الأول، ويحتفظ بشكل مستقل بمستودع PyTorch، الذي يمكنه تحويل CUDA إلى CUNN باستخدام سطر واحد فقط من التعليمات البرمجية. إن إمكانية تحسين الأداء هائلة أيضًا، ويمكن تحقيق أداء أعلى من خلال التحسين المخصص.
ومع ذلك، تجدر الإشارة إلى أن ما هو معروف حاليًا هو أن جهاز Ascend 910CAI يتمتع بأداء استدلالي ممتاز، ولكنربما لا يزال أداء تدريب الذكاء الاصطناعي غير مرضٍ.
شينغتنغ 910