اختبار نموذج الذكاء الاصطناعي ذو 6 مليارات معلمة: تتقدم Intel بفارق 2.4 مرة، وهي البديل الوحيد لـ NVIDIA

أعلنت MLCommons رسميًا عن نتائج اختبار قياس الأداء لاستدلال MLPerf v3.1 لنموذج اللغة الكبير الذي يحتوي على 6 مليارات معلمة ونموذج رؤية الكمبيوتر ومعالجة اللغة الطبيعية GPT-J. كان أداء معالج Intel CPU ومسرع الذكاء الاصطناعي جيدًا ويتمتعان بقدر كبير من المنافسة في استدلال الذكاء الاصطناعي.

أظهرت نتائج تدريب MLCommonsAI التي تم الكشف عنها سابقًا ونتائج اختبار الأداء القياسي HuggingFace في يونيو أن مسرع Intel Gaudi2AI يمكنه تجاوز أداء مسرع NVIDIA H100 تمامًا في نماذج اللغة المرئية المتقدمة.يمكن أن يطلق عليه البديل الوحيد الممكن لـ NVIDIAH100/A100وآخر النتائج تؤكد ذلك مرة أخرى.

في نموذج GPT-J، يبلغ أداء استعلام الخادم GPT-J-99 وGPT-J-99.9 واستعلام الخادم GPT-J-99.9 لمسرع Intel Gaudi2 وأداء الاستدلال النموذجي دون اتصال 78.58 مرة/ثانية و84.08 مرة/ثانية على التوالي.

بالمقارنة مع المنتجات المنافسة، يتمتع H100 بمزايا أداء 1.09 مرة (الخادم) و1.28 مرة (غير متصل بالإنترنت) مقارنة بـ Gaudi2. يتمتع Gaudi2 بمزايا أداء 2.4 مرة (الخادم) ومرتين (غير متصل) مقارنة بـ A100.

ومن الجدير بالذكر ذلكتستخدم النتائج المقدمة من Gaudi2 نوع البيانات FP8 بدقة تبلغ 99.9%.

يتم تحديث برنامج Gaudi2 كل 6-8 أسابيع وسيستمر في تحسين أداء معيار MLPerf وتوسيع تغطية النموذج.

وفي الوقت نفسه، قدمت إنتل 7 اختبارات مرجعية للاستدلال تعتمد على معالجات Xeon من الجيل الرابع القابلة للتطوير من SapphireRapids، بما في ذلك نموذج GPT-J.

تظهر النتائج أن الجيل الرابع من Xeon يعمل بشكل جيد للغاية عند التعامل مع أعباء عمل الذكاء الاصطناعي العامة، بما في ذلك نماذج الرؤية ومعالجة اللغة والكلام والترجمة الصوتية، بالإضافة إلى نموذج توصيات التعلم العميق الأكبر DLRMv2 ونموذج ChatGPT-J.

اعتبارًا من الآن،تظل Intel المورد الوحيد الذي يقدم نتائج وحدة المعالجة المركزية العامة باستخدام برامج النظام البيئي للتعلم العميق المتوافقة مع معايير الصناعة.

ووفقا لآخر النتائج،باستخدام GPT-J لتلخيص بيان صحفي مكون من 1000 كلمة تقريبًا، يمكن للجيل الرابع من Xeon إكمال فقرتين في الثانية في وضع عدم الاتصال، وفقرة واحدة في الثانية في وضع الخادم في الوقت الفعلي.

أيضًا،تقدم Intel نتائج اختبار MLPerf لمعالجات Xeon CPUMax لأول مرة، التي تدمج ما يصل إلى 64 جيجابايت من ذاكرة HBM3 ذات النطاق الترددي العالي، هي وحدة المعالجة المركزية الوحيدة التي يمكنها تحقيق دقة بنسبة 99.9% لـ GPT-J، وهي مناسبة جدًا للتطبيقات ذات متطلبات الدقة العالية للغاية.

قم بزيارة صفحة الشراء:

متجر إنتل الرئيسي