في أكتوبر 2024، أنشأت AMD وIntel بشكل مشترك المجموعة الاستشارية للنظام البيئي x86 (المجموعة الاستشارية للنظام البيئي x86) لجمع قادة الصناعة معًا للترويج لمستقبل بنية الحوسبة x86. عندما تم تأسيس EAG، أعلنت عن أربع ميزات أساسية: FRED، وAVX10، وChkTag، وACE.الآن أصدرت AMD وIntel بشكل مشترك الورقة البيضاء ACE، للترويج رسميًا لمجموعة التعليمات هذه المعروفة باسم "x86 Standard Matrix Acceleration Architecture" لمجتمع المطورين.

الهدف الأساسي لـ ACE واضح ومباشر: تحسين أداء ضرب المصفوفة لرقائق x86 بأوامر من حيث الحجم.
مضاعفة المصفوفة هي وحدة الحوسبة الأساسية للشبكات العصبية ونماذج اللغات الكبيرة. على الرغم من أن مجموعات تعليمات SIMD الحالية، مثل AVX10، يمكنها إكمال عمليات المصفوفة، إلا أن هناك اختناقات واضحة في كثافة الحوسبة وقابلية التوسع.
من خلال تقديم آلية تسريع المصفوفة بناءً على عمليات المنتج الخارجي، يحقق ACE كثافة حسابية تبلغ 16 ضعفًا لعملية التراكم المضاعفة المكافئة لـ AVX10 مع استهلاك نفس متجه الإدخال.
فيما يتعلق بدعم تنسيق البيانات، يغطي ACE أصلاً معايير الدقة السائدة الحالية في مجال الذكاء الاصطناعي، بما في ذلك INT8 وOCP FP8 وOCP MXFP8 وOCP MXINT8 وBF16.
وباعتبارها مجموعة تعليمات موسعة لـ AVX10، فإن التكيف البيئي لبرنامج ACE قيد التقدم بالفعل. لقد بدأت المكتبات الأساسية للتعلم العميق وHPC، ومكتبات الحوسبة العلمية Python مثل NumPy وSciPy، وأطر التعلم الآلي السائدة مثل PyTorch وTensorFlow، أعمال التكامل.
أكدت AMD وIntel في الورقة البيضاء على أن مفهوم تصميم ACE هو الاحتكاك المنخفض والتغطية الواسعة. من أجهزة الكمبيوتر المحمولة إلى أجهزة الكمبيوتر العملاقة، لا يحتاج المطورون إلى إعادة كتابة التعليمات البرمجية لمنصات الأجهزة المختلفة.
وهذا يتناقض بشكل حاد مع الحل المتمثل في ترحيل حوسبة الذكاء الاصطناعي إلى مسرعات مخصصة، الأمر الذي يتطلب غالبًا تكييفًا إضافيًا للكود وتكاليف ترحيل.
