مشاكل ملك GPU. وباعتبارها المستفيد الأساسي من منطق "شراء المجرفة"، أصبح أداء NVIDIA الذي حطم الأرقام القياسية هو ركيزة الثقة التي تدعم سوق الذكاء الاصطناعي التوليدي. ومع ذلك، خلف الأداء الممتاز، فإن المشكلة الأكثر أهمية هي أنه نظرًا لقدرة الإنتاج المحدودة، لا تستطيع Nvidia تلبية طلب السوق على وحدات معالجة الرسومات. في أغسطس، ذكرت وسائل الإعلام أن طلبات H100 قد تم وضعها في قائمة الانتظار حتى الربع الأول أو حتى الربع الثاني من العام المقبل.

وفقًا لتكهنات GPUUtils، تشير التقديرات المتحفظة إلى أن إجمالي الطلبات المحتملة لوحدات معالجة الرسومات NVIDIA قد يتجاوز 20 مليار دولار أمريكي، وأن فجوة العرض لوحدة معالجة الرسوميات GPUH100 تصل إلى 430.000 وحدة.

كما قال الرئيس التنفيذي لشركة NVIDIA Jensen Huang بصراحة:

"شحناتنا الحالية ليست قريبة من تلبية الطلب."

تكمن صعوبة Lao Huang في التقنيتين الرئيسيتين العالقتين في عنق Nvidia - تغليف CoWoS وذاكرة HBM.

SK Hynix وTSMC هما اللاعبان اللذان يقفان وراء رقبة Nvidia

يعد H100، الذي تم إطلاقه في سبتمبر من العام الماضي، وحدة معالجة الرسوميات الأكثر تقدمًا في مصفوفة منتجات Nvidia.

بالمقارنة مع سابقتها A100، ارتفع سعرها بحوالي 1.5-2 مرة، لكن أدائها حقق قفزة نوعية: زادت سرعة الاستدلال بمقدار 3.5 مرة، وزادت سرعة التدريب بمقدار 2.3 مرة؛ إذا تم استخدام الحوسبة العنقودية للخادم، فيمكن زيادة سرعة التدريب إلى 9 مرات. في تدريب LLM، يمكن تقصير عبء العمل الأصلي لمدة أسبوع واحد إلى 20 ساعة.

يتكون NVIDIA H100 بشكل أساسي من ثلاثة أجزاء: هناك ثلاثة مكدسات HBM على جانبي قالب H100 المركزي، والطبقة الخارجية هي إطار التعبئة 2.5DCoWoS الخاص بـ TSMC.


من بين المكونات الثلاثة، يعد مصدر الرقاقة المنطقية الأساسية هو الأبسط. يتم إنتاجه بشكل أساسي في مصنع تاينان رقم 18 التابع لشركة TSMC ويستخدم عقدة المعالجة 4N (في الواقع 5nm+). نظرًا لضعف أسواق شرائح أجهزة الكمبيوتر والهواتف الذكية ومراكز البيانات غير المرتبطة بالذكاء الاصطناعي التي تصل إلى 5nm+، فإن معدل استخدام السعة 5nm+ من TSMC حاليًا أقل من 70%. لذلك، لا توجد مشكلة في توريد الرقائق المنطقية.

تأتي فجوة العرض الرئيسية لـ Nvidia من ستة HBM (ذاكرة النطاق الترددي العالي، ذاكرة النطاق الترددي العالي) على جانبي الشريحة المنطقية، وحزمة CoWoS (Chiponwafer on Substrate، chip، chip، the substrate package) التي تربط شريحة المنطق وHBM.

HBM عبارة عن شريحة ذاكرة DRAM تعتمد على تقنية التراص ثلاثي الأبعاد. يتمثل المبدأ الفني في تكديس شرائح DDR المتعددة معًا بشكل عمودي، وتوصيل الرقائق ببعضها البعض من خلال تقنية silicon vias (TSV) والمطبات الصغيرة (μBmps)، وبالتالي اختراق قيود الأداء الحالية، وزيادة سعة التخزين بشكل كبير، وتحقيق مصفوفة مجموعة DDR مع عرض نطاق ترددي أعلى، وعرض بت أعلى، واستهلاك أقل للطاقة، وحجم أصغر.

تعتبر رقائق الذاكرة ضرورية لأداء وحدة معالجة الرسومات، وخاصة وحدات معالجة الرسومات عالية الأداء المستخدمة لتدريب الذكاء الاصطناعي. تعد أعباء عمل الاستدلال والتدريب من المهام التي تستهلك الذاكرة بشكل كبير. مع زيادة عدد المعلمات في نماذج الذكاء الاصطناعي بشكل كبير، فإن الأوزان وحدها تدفع أحجام النماذج إلى تيرابايت. ولذلك، فإن القدرة على تخزين واسترجاع بيانات التدريب والاستدلال من الذاكرة تحدد الحد الأعلى لأداء وحدة معالجة الرسومات. كلما زاد عدد نماذج وتطبيقات الذكاء الاصطناعي الكبيرة، كان ذلك أفضل لمصنعي HBM.

وبالنظر إلى سوق HBM بشكل عام، فإن شركتي التخزين الكوريتين العملاقتين SK Hynix وSamsung تتمتعان باحتكار مطلق، حيث تبلغ حصتهما السوقية مجتمعة حوالي 90٪.


يتم توفير HBM3 المستخدم في NVIDIA H100 حصريًا بواسطة SK Hynix، وهو منتج HBM الأكثر تقدمًا حاليًا.

يحتوي HBM3 على عمليات معقدة وتكاليف عالية وقدرة إنتاجية محدودة. وفي عام 2022، سيمثل HBM3 حوالي 8% فقط من حصة السوق في سوق HBM بأكمله. باعتبارها الشركة الوحيدة في العالم القادرة على إنتاج HBM3 بكميات كبيرة، قامت SK Hynix بإغلاق عنق Nvidia H100 بقوة؛ بينما يستخدم الجيل السابق A100/A800 وAMD's MI200 تقنية HBM2E من الجيل الخلفي.

ومع ذلك، فإن صناعة شرائح الذاكرة تجري حاليًا عملية الترقية من HBM2E إلى HBM3. وفقًا لبيانات Trendforce، من المتوقع أن تتجاوز حصة سوق HBM3 60% بحلول عام 2024. ويخطط مصنعو شرائح الذاكرة مثل Samsung وMicron بنشاط لنشرها ويتطلعون إلى حصة SK Hynix في السوق.


التغليف المتقدم عبارة عن تقنية مكملة لذاكرة HBM - لاستخدام مكدس HBM، يجب استخدام التغليف المتقدم لتوصيل الذاكرة ووحدة معالجة الرسومات.

التعبئة والتغليف المتقدمة TSMC CoWoS المستخدمة في H100 هي تقنية تعبئة 2.5D.

يعد حل التغليف ثنائي الأبعاد السائد طريقة تكامل يتم من خلالها تثبيت جميع الرقائق والمكونات السلبية أفقيًا على سطح الركيزة، على غرار اللغز المستوي.


يمكن مقارنة العبوة المتقدمة 2.5D بوحدات البناء المرتبة أفقيًا. يجب أن تعتمد مجموعة HBM من شرائح DDR متعددة الطبقات على التغليف المتقدم لتحقيقها.



يعد حل التغليف المتقدم CoWoS من TSMC مزيجًا من CoW ونظام التشغيل: أولاً، يتم توصيل الشريحة برقاقة السيليكون من خلال عملية التعبئة ChiponWafer (CoW)، ثم يتم توصيل شريحة CoW بالركيزة (onSubstrate) للتكامل في CoWoS.


لقد حسنت تقنية CoWoS بشكل كبير كثافة الاتصال البيني وعرض النطاق الترددي لنقل البيانات، مع تقليل حجم الحزمة، ولكن العملية أيضًا معقدة للغاية، لذلك يتم استخدامها بشكل أساسي في السوق الراقية.

وفقًا لتقارير وسائل الإعلام، تبلغ الطاقة الإنتاجية الشهرية الحالية لتعبئة CoWoS لشركة TSMC 8000 قطعة، ومن المتوقع أن ترتفع إلى 11000 قطعة بحلول نهاية هذا العام. ومن المتوقع أن تحقق طاقة إنتاجية شهرية تبلغ حوالي 14500 إلى 16600 قطعة بنهاية عام 2024. بمعنى آخر، سيستغرق الأمر ما يقرب من عام ونصف لمضاعفة الإنتاج.

يصل قانون مور إلى ذروته، وسوف تصبح التعبئة والتغليف المتقدمة هي السائدة

أصبحت حلول مثل HBM، التي يتم فيها تكديس شرائح متعددة ثم ربطها معًا من خلال التغليف المتقدم، فكرة التصميم السائدة للرقائق المتطورة في السوق الحالية.

السبب وراء ذلك بسيط: لقد تكررت العمليات المتقدمة الآن إلى 7 نانومتر، و5 نانومتر، و3 نانومتر، وأصبحت العقد التكنولوجية أصغر وأصغر، وأصبحت تكنولوجيا الإنتاج وعمليات التصنيع أكثر تعقيدًا، واستثمار رأس المال في معدات تصنيع الدوائر المتكاملة يزداد ارتفاعًا وأعلى.

خذ 5 نانومتر والعمليات الأصغر كمثال. في هذه المرحلة، وبسبب قيود الطول الموجي، لم تعد دقة آلات الطباعة الحجرية العادية قادرة على تلبية متطلبات العملية، ويجب على الشركات أن تلجأ إلى آلات الطباعة الحجرية بالأشعة فوق البنفسجية باهظة الثمن، والتي تصل تكلفة كل منها إلى 1.4 مليار يوان.

إلى جانب معدات مثل النقش وترسيب الأغشية الرقيقة، يمكن أن تصل تكلفة المعدات اللازمة لعملية 5 نانومتر إلى 3.1 مليار دولار أمريكي، وهو أكثر من ضعف تكلفة 14 نانومتر وحوالي أربعة أضعاف تكلفة 28 نانومتر.

من أجل أن تكون فعالة من حيث التكلفة، لا يمكن لمصنعي الرقائق إلا إيجاد طريقة أخرى لتحسين كثافة الترانزستور والأداء من خلال تحسين العملية الخالصة لتصميم الرقائق على مستوى النظام.

ومن ناحية أخرى، فقد تزايد حجم حوسبة البيانات العالمية بشكل هائل في السنوات العشر الماضية، متجاوزًا إجمالي الأربعين عامًا الماضية. ومع تزايد الطلب على الإلكترونيات الاستهلاكية ورقائق السيارات، حتى لو تمكنت عملية تصنيع الرقائق من الوصول إلى الحد المادي النظري لقانون مور (1 نانومتر)، فإنها ستظل غير قادرة على تلبية احتياجات التطبيقات الصناعية المستقبلية.

أصبح التغليف المتقدم، لأنه يمكنه تحسين أداء المنتج وخفض التكاليف في نفس الوقت، حلاً لعصر ما بعد مور.

إن الطلب الهائل الناتج عن الذكاء الاصطناعي التوليدي يعمل بالفعل على تسريع عملية التحول من التغليف التقليدي إلى التغليف المتقدم.

وأشار مورجان ستانلي إلى أن موجة الذكاء الاصطناعي تعمل على تعزيز التطبيق واسع النطاق لتقنيات التعبئة والتغليف المتقدمة 2.5D و3D. بحلول عام 2030، سيشكل التغليف المتقدم أكثر من 60% من سوق التغليف بأكمله.


وفقًا لتقديرات FutureMarketInsights، فإن سوق التغليف المتقدم، الذي تبلغ قيمته حاليًا حوالي 31 مليار دولار أمريكي، سيستمر في التوسع بمعدل نمو سنوي مركب قدره 7.2٪ في السنوات العشر المقبلة.

وأشار محللو مورجان ستانلي أيضًا إلى أنه نظرًا لأن نمو شرائح الذكاء الاصطناعي يتجاوز التوقعات، فمن المتوقع أن تنمو عمليات التعبئة والتغليف المتقدمة ثلاثية الأبعاد / 2.5 دي بمعدل سريع للغاية. وسيصل معدل النمو السنوي المركب من عام 2021 إلى عام 2028 إلى حوالي 22٪.


لقد حققت الشركة المصنعة التي تصنع بطاقات عنق NVIDIA الكثير من المال

لقد تذوقت الآن الشركتان الرائدتان في مجال ذاكرة HBM والتغليف المتقدم، SK Hynix وTSMC، الحلاوة.

تظهر بيانات TrendForce أنه على الرغم من انخفاض شحنات سوق شرائح الذاكرة ومتوسط ​​أسعار وحدات المبيعات تحت تأثير الانكماش في سوق الإلكترونيات الاستهلاكية، إلا أن منتجات HBM خالفت الاتجاه وهي تنمو، مع ارتفاع الأسعار على طول الطريق.

ذكرت بعض وسائل الإعلام أن طلبات HBM من اثنتين من الشركات المصنعة الكبرى لوحدات التخزين، Samsung وSK Hynix، زادت بسرعة منذ بداية عام 2023. وقد زاد سعر HBM3، الذي توفره SK hynix حصريًا، خمسة أضعاف. وباعتباره منتجًا بهوامش ربح عالية وسعر وحدة أعلى بكثير من المواصفات الأخرى لرقائق الذاكرة، فإن ربح HBM3 مرعب. تتوقع TrendForce أنه بفضل موجة الذكاء الاصطناعي، ستصل إيرادات HBM الإجمالية إلى 8.9 مليار دولار أمريكي في عام 2024، بزيادة سنوية قدرها 127٪.

في الوقت نفسه، مع المبيعات الساخنة لـ NVIDIA H100 وAMDMI300، هناك أيضًا نقص في عبوات TSMC المتقدمة.

وقال محللو مورجان ستانلي:

استنادًا إلى فحوصات سلسلة توريد المسبك التي نقوم بها، يتم بيع رقاقة CoWoS-S واحدة (والعمليات المرتبطة بها) بسعر يتراوح بين 6000 دولار و12000 دولار، اعتمادًا على حجم العميل/المشروع وتعقيد التصميم. وفقًا للمعلومات التي كشفت عنها TSMC في اجتماع تقريرها المالي للربع الثاني، من المتوقع أن يأتي 6-7% من إجمالي الإيرادات في عام 2023 من التغليف والاختبار المتقدم.

نحن نقدر أن CoWoS قد تساهم بحوالي مليار دولار أمريكي من الإيرادات لشركة TSMC هذا العام. مع استمرار TSMC في زيادة طاقتها الإنتاجية لـ CoWoS (ستتضاعف السعة في عام 2024، وفقًا للبيانات المقدمة في مكالمة أرباح الربع الثاني من TSMC) والطلب القوي الحالي على شرائح الذكاء الاصطناعي، فمن المرجح أن ينمو هذا الرقم أكثر. لذلك، نتوقع أن يصل معدل النمو السنوي المركب لإيرادات CoWoS الخاصة بشركة TSMC إلى 40٪ من عام 2023 إلى عام 2027.

وصول:

جينغدونغ مول