تخطط NVIDIA للسماح لوحدات معالجة الرسوميات بالوصول مباشرة إلى مساحة التخزين، وهو ما من المتوقع أن يؤدي إلى تسريع HBF

مع استمرار توسع نماذج الذكاء الاصطناعي، قد لا تتمكن HBM من تلبية المتطلبات المستقبلية لسعة ذاكرة الفيديو، مما يدفع الصناعة إلى النظر إلى بنية التخزين المعتمدة على وحدة معالجة الرسومات باعتبارها حدودًا تكنولوجية تالية محتملة. في العام الماضي، كانت هناك أخبار تفيد بأن Nvidia كانت تعمل مع SK Hynix وKioxia على التوالي لتعزيز تطوير AI SSD واستخدام أجزاء SSD مصممة خصيصًا لتحل محل HBM كموسع لذاكرة GPU. بالإضافة إلى ذلك، تعاونت SK Hynix هذا العام أيضًا مع SanDisk لجلب HBF (High Bandwidth Flash)، وهو حل ذاكرة من الجيل التالي لعصر الاستدلال بالذكاء الاصطناعي، لحل نفس المشكلة.

تخطط Nvidia للسماح لوحدات معالجة الرسومات بالوصول مباشرة إلى مساحة التخزين، ومن المتوقع أن يؤدي ذلك إلى تسريع HBF

وفقًا لتقارير TrendForce، تعمل Nvidia على تطوير بنية تخزين الوصول المباشر لوحدة معالجة الرسومات وتخطط لتقديمها من منصة Vera Rubin وتنشيط وظيفة GIDS (الوصول المباشر للتخزين الذي بدأته وحدة معالجة الرسومات). يعتقد الغرباء أن هذا التغيير قد يؤدي إلى تسريع عملية تطوير HBF.

تختلف GIDS عن وظيفة GDS (التخزين المباشر لوحدة معالجة الرسومات) الحالية. هناك فرق بين الاثنين: في GDS، ترسل وحدة المعالجة المركزية طلب بيانات إلى جهاز التخزين قبل نقل البيانات إلى وحدة معالجة الرسومات. في GIDS، تصل وحدة معالجة الرسومات مباشرة إلى جهاز التخزين، متخطية وحدة المعالجة المركزية وذاكرة الوصول العشوائي الديناميكية (DRAM) في المنتصف.

يهدف كل من GIDS وGDS إلى التغلب على اختناقات نقل البيانات في بنيات الحوسبة التقليدية، ويشاع أن Microsoft وAMD تستكشفان أساليب مماثلة. المشكلة الرئيسية هي أن الطريقة التقليدية لنقل البيانات غير فعالة. تتمتع وحدة المعالجة المركزية ببنية محدودة في معالجة الخيوط، بينما يمكن لوحدة معالجة الرسومات إنشاء عشرات الآلاف من الخيوط المتوازية. حاليًا، يمثل نقل البيانات GPU-HBM حوالي نصف إجمالي استهلاك طاقة النظام، مما يدعم أيضًا بنية HBF ويجعل ذاكرة فلاش NAND فائقة السرعة أقرب إلى وحدة معالجة الرسومات للتعامل مع اختناقات الذكاء الاصطناعي المستقبلية.

قد يسمح ظهور GIDS لـ NAND flash بلعب دور أكثر أهمية في أنظمة تخزين الذكاء الاصطناعي، مع تقليل الضغط على HBM من حيث السعة. يتطلب هذا التحول ذاكرة فلاش NAND ذات أداء أعلى لمواكبة سرعات معالجة وحدة معالجة الرسومات. تتمثل ميزة ذاكرة فلاش NAND في كثافة البت الخاصة بها، والتي تبلغ حوالي 30 مرة ضعف كثافة ذاكرة DRAM، مما يحقق سعة تخزين أكبر في مساحة مماثلة.

ومع ذلك، تتمتع ذاكرة فلاش NAND بمتانة محدودة، في حين تتمتع ذاكرة DRAM بقدرات كتابة غير محدودة تقريبًا. لذلك، يعتبر HBF أكثر ملاءمة لتخزين معلمات نموذج الذكاء الاصطناعي، لأن هذا الجزء من البيانات يظل دون تغيير بشكل أساسي أثناء عملية الاستدلال ويستخدم فقط كأعباء عمل للقراءة فقط.