وفقًا للأخبار الصادرة في 17 ديسمبر، وفقًا لموقع Jinyang.com، في السادس من هذا الشهر، تم عقد مؤتمر تطبيقات ابتكار الحوسبة الفائقة لعام 2023 تحت عنوان "اندماج الذكاء الفائق، الحوسبة تبدأ فصلًا جديدًا" في مدينة قوانغتشو. في هذا المؤتمر، أطلق المركز الوطني للحوسبة الفائقة في قوانغتشو رسميًا الجيل الجديد من نظام الحوسبة الفائقة المحلي للمركز - "Tianhe Xingyi".

وفقًا للو يوتونغ، مدير المركز الوطني للحوسبة الفائقة في قوانغتشو، فإن "Tianhe Xingyi" يتمحور حول التطبيقات ويتم بناؤه باستخدام تقنيات رئيسية مثل بنية الحوسبة المتقدمة المحلية، والمعالجات متعددة النواة عالية الأداء، وشبكات التوصيل البيني عالية السرعة، والتخزين واسع النطاق.

لقد ضاعف قوة الحوسبة العامة لوحدة المعالجة المركزية وقدرات الشبكة وقدرات التخزين وقدرات خدمة التطبيقات مقارنة بـ "Tianhe-2"، ويدعم احتياجات سيناريوهات التطبيقات المختلفة مثل الحوسبة عالية الأداء والتدريب على النماذج الكبيرة للذكاء الاصطناعي وتحليل البيانات الضخمة.

وستعمل على تعزيز قدرات خدمة التطبيقات متعددة المجالات لمركز قوانغتشو الوطني للحوسبة الفائقة، وتوفير قوة حوسبة متطورة قوية ودعم منصة للاختراقات العلمية والتكنولوجية المتطورة، والبناء الهندسي الاستراتيجي، والتحديث والتحول الصناعي في قوانغتشو، مقاطعة قوانغدونغ، ومنطقة خليج قوانغدونغ-هونغ كونغ-ماكاو الكبرى، وتعزيز قوة الابتكار العلمي والتكنولوجي الأساسية لقوانغتشو بشكل فعال كمدينة مركزية وطنية ومدينة بوابة شاملة، ودعم التنمية عالية الجودة للعلوم والتكنولوجيا والاقتصاد الإقليمي، والمجتمع.


وقال تشن تشيجوانج، نائب مدير المركز الوطني للحوسبة الفائقة في قوانغتشو، إن "Tianhe Xingyi" تتبنى تكنولوجيا الحوسبة الفائقة الأكثر تقدمًا. بالمقارنة مع النظام الأصلي، زادت قوة الحوسبة العامة بمقدار 5 مرات. وشدد أيضًا على تحسين قدرات التطبيقات وهناك مجال لمزيد من تطوير برامج التطبيقات.

الهدف النهائي لإنترنت الحوسبة الفائقة هو تحقيق التواصل على مستوى البلاد، والخطوة التالية هي تحقيق التواصل مع Shenzhen Supercomputing وWuxi Supercomputing.

زادت قوة الحوسبة العامة لـ Tianhe Xingyi بمقدار 5 مرات

ووفقا للبيانات، تم نشر "تيانخه-2" في المركز الوطني للحوسبة الفائقة في قوانغتشو. يستخدم Intel Watt، والأداء النظري هو 54.9PFLOPS (549 مليار مرة)، والأداء الأقصى لـ Linpack هو 33.86PTFLOPS. لم يتغير أدائه من يونيو 2013 إلى يونيو 2016، وتم انتخابه كبطل TOP500 ست مرات.


كان لدى Tianhe-2 في الأصل خطة ترقية لاحقة، ولكن في عام 2015 أصدرت الحكومة الأمريكية حظرًا يحظر على شركات مثل Intel تصدير رقائق الحوسبة عالية الأداء إلى مراكز الحوسبة الفائقة الأربعة في الصين. ونتيجة لذلك، لم يعد بإمكان Tianhe-2، الذي يستخدم بطاقات تسريع Intel Xeon Phi، استخدام الرقائق عالية الأداء من الشركات الأمريكية.

في سبتمبر 2017، أعلن مركز قوانغتشو للحوسبة الفائقة أنه سيقوم بتحديث نظام الحوسبة الفائقة Tianhe-2 بحلول نهاية عام 2017.استخدم المسرع المحلي Matrix2000 ليحل محل مسرع IntelXeonPhi الأصلي.

من المفهوم أن البنية الصحيحة لـ Matrix2000 يجب أن تكون ARM، لكن وحدة المتجهات عبارة عن وحدة متجهة 256 بت VFU مخصصة محليًا.

يتكون كل Matrix2000 من 128 نواة، ويبلغ تردده 1.2 جيجا هرتز، ويمكنه إجراء 16 عملية مزدوجة الدقة في كل دورة، ويبلغ أداء المعالج الذروة 2.45TFLOPS. يُطلق على Tianhe-2 الذي تمت ترقيته اسم Tianhe 2A، وقد تمت زيادة أداءه الأقصى من 54.9PFLOPS السابق إلى حوالي 100PFLOPS.


وفقًا للبيان الرسمي، فإن الأداء العام لـ "Tianhe Xingyi" أعلى بخمس مرات من النظام الأصلي ("Tianhe 2" الذي تمت ترقيته، والمعروف أيضًا باسم Tianhe 2A) من حيث قوة الحوسبة العامة. بمعنى آخر، يجب أن تصل قوة الحوسبة القصوى لـ "Tianhe Xingyi" إلى حوالي 600PFlop/s (5 مليار مرة في الثانية).

تجدر الإشارة إلى أنه في "مؤتمر ChinaSC2023 الخامس لقوة الحوسبة الفائقة الصينية" الذي عقد في بكين في 10 نوفمبر من هذا العام، تم إصدار تصنيف أفضل 100 أداء للكمبيوتر عالي الأداء في الصين لعام 2023، والذي كشف عن معايير أداء "المعالج متعدد النواة لنظام مضيف مركز الحوسبة الفائقة غير المتجانس" الذي تم تثبيته في مركز الحوسبة الفائقة في عام 2023.

يصل عدد نواة وحدة المعالجة المركزية الخاصة به إلى 15,974,400 نواة، ويصل أعلى أداء له إلى 620PFLOPS، متجاوزًا Sunway TaihuLight. من الواضح أن هذه البيانات تتفق مع البيان السابق حول القوة الحاسوبية لـ "Tianhe Xingyi".


في 12 أغسطس من هذا العام، أعلنت الجامعة الوطنية لتكنولوجيا الدفاع عن "إعلان التفاوض أحادي المصدر (2023-YKJSJY-F5027) لخدمات وقت الآلة لعقدة الحوسبة الذكية للحوسبة الفائقة من الجيل الجديد المحلي من Tianhe"، والذي أظهر أنه "من المخطط شراء 360.000 عقدة من خدمات وقت الآلة لعقدة الحوسبة الذكية للحاسوب العملاق من الجيل الجديد المحلي من Tianhe لاختبار وظائف وأداء الديناميكية والتحقق منها برنامج حساب حقل الرياح المورد التعاوني المقترح: مركز تيانجين الوطني للحوسبة الفائقة.

أسباب اختيار مركز تيانجين الوطني للحوسبة الفائقة كمورد واحد هي:

"نظرًا لأن المشروع يحتاج إلى اختبار والتحقق من بيئة برنامج حساب مجال الرياح الديناميكي على نظام حوسبة محلي عالي الأداء مزود بمعالج MT3000، فمن الضروري شراء 360,000 ساعة عقدة من خدمات وقت الكمبيوتر لنظام الحوسبة المحلي عالي الأداء.

النظام المضيف للحوسبة الفائقة في Tianjin هو نظام Tianhe-1 (TH-1A) ونظام الجيل الجديد Tianhe (بما في ذلك نظام التحقق من المستوى E). من بينها، يحتوي نظام الجيل الجديد من Tianhe على عقد حاسوبية تعتمد على معالجات MT3000، والتي يمكنها تلبية احتياجات المشروع. في الوقت الحالي، لا يستطيع سوى Tianjin Supercomputer توفير بيئة حوسبة محلية عالية الأداء تعتمد على معالجات MT3000. ولذلك، من المقرر أن يتم هذا الشراء من مصدر واحد. "


في يوليو 2018، ذكرت وكالة أنباء شينخوا أن النموذج الأولي للفئة "تيانخه-3"، وهو "جيل محلي جديد من حاسوب إكساسكيل العملاق الذي طوره مركز تيانجين للحوسبة الفائقة، قد تم تطويره ونشره واجتاز بنجاح القبول المفصل".

يستخدم نظام النموذج الأولي ثلاث شرائح حوسبة واتصالات عالية الأداء منتجة محليًا. "وفي وقت لاحق في عام 2019، أظهرت تقارير أخرى أن "النموذج الأولي للكمبيوتر العملاق "Tianhe-3" في بلدي قد أكمل اختبار التطبيقات المتوازية على نطاق واسع لأكثر من 30 وحدة وفتح الخدمات تدريجيًا."

بناءً على المعلومات المذكورة أعلاه، فإن "Tianhe-3" المشاع بقدرة حوسبة على المستوى الإلكتروني يستخدم تمامًاالمعالج MT3000 المحلي.

من المحتمل أن يعتمد "Tianhe Xingyi" الذي أصدره مركز الحوسبة الفائقة في قوانغتشو على معالج MT3000، وبالطبع قد يعتمد أيضًا على Matrix2000+ المشاع. لا توجد حاليًا أي معلومات إضافية حول معالج MT3000، لكن الأمر المؤكد هو أن أداءه سيتحسن بشكل ملحوظ مقارنة بالجيل السابق MT2000.

الكمبيوتر العملاق المحلي من الفئة E Shenwei Ocean Light

بالإضافة إلى ذلك، تجدر الإشارة إلى أنه بالمقارنة مع نظام الكمبيوتر العملاق "Sunway TaihuLight" الأقوى من Tianhe 2A،ويستخدم 40960 معالجًا متعدد النواة "Shenwei 26010" تم تطويره بشكل مستقل في الصين.

يستخدم هذا المعالج متعدد النواة نظام تعليمات Shenwei المستقل 64 بت، مع تردد تشغيل أساسي يبلغ 1.45 جيجا هرتز وأداء ذروة يبلغ 3.168 تريليون عملية في الثانية. يوجد 40,960 معالجًا مثبتًا في Sunway TaihuLight. يمكن أن يصل أداء الذروة الإجمالي إلى 1.25 مليار مرة في الثانية، والأداء المستدام 9.3 مليار مرة في الثانية.

سيستخدم الجيل الجديد المشاع من حاسوب Sunway العملاق - Sunway Oceanlite (Sunway Oceanlite) معالج Sunway SW26010-Pro الجديد، والذي من المتوقع أن يوفر أداءً أكثر قوة.

في مؤتمر SC23 (المؤتمر الدولي للحوسبة والشبكات والتخزين والتحليل عالي الأداء، وهو مؤتمر رفيع المستوى في مجال الحوسبة والهندسة المعمارية عالية الأداء) الذي عقد في نوفمبر من هذا العام، أظهر العلماء الصينيون للعالم معالج Sunway SW26010-Pro الجديد، الذي يتمتع بأداء أعلى بأربع مرات من الجيل السابق. هذه سلسلة من منتجات المعالجات التي تتبنى بلدي مجموعة التعليمات الخاصة بها (استنادًا إلى توسيع ألفا) وتتمتع بحقوق ملكية فكرية مستقلة تمامًا.

وفقًا لبيانات PPT، يعد SW26010pro نسخة محسنة من SW26010، ويتألف من 6 وحدات أساسية ووحدة معالجة بروتوكول واحدة (PPU). تحتوي كل وحدة على نواة واحدة لإدارة سلاسل عمليات Linux (MPE) و64 نواة حوسبة، بإجمالي 384 نواة. في المقابل، يحتوي الجيل السابق SW26010 على 4 مجموعات أساسية فقط، مما يشير إلى أن شريحة SW26010pro الفردية يجب أن تتمتع بتحسين الأداء بنسبة 50%.


شبكة المعالج SW26010Pro المكونة من 64 نواة حسابية (8 × 8) هي وحدة معالجة حسابية (CPE) مزودة بذاكرة تخزين مؤقت تبلغ سعتها 256 كيلوبايت. يحتوي كل CPE على أربع كتل منطقية ويمكن أن يدعم FP64 وFP32 على زوج واحد، وFP16 وBF16 على الزوج الآخر.


توجد وحدة تحكم في الذاكرة DDR4-3200 وذاكرة 16 جيجابايت على كل وحدة أساسية في SW26010Pro، مع نطاق ترددي للذاكرة يبلغ 51.4 جيجابايت/ثانية، وبالتالي فإن المعالج بأكمله يحتوي على 96 جيجابايت من الذاكرة الرئيسية (تحسن كبير مقارنة بـ 32 جيجابايت في SW26010) وعرض النطاق الترددي 307.2 جيجابايت/ثانية.

يتم توصيل أجهزة CPE الستة عبر حلقة ربط وتحتوي على واجهتين للشبكة تستخدم وصلة خاصة لتوصيلها بالخارج. تتمتع شريحة SW26010Pro بدقة FP64 أو FP32 تبلغ 14.03PB ودقة BF16 أو FP16 تبلغ 55.3PB.


بالإضافة إلى ذلك، يعمل نواة MPE الخاصة بـ SW26010Pro بسرعة 2.1 جيجا هرتز (كان منتج الجيل السابق 1.45 جيجا هرتز فقط)، ويعمل نواة CPW بسرعة 2.25 جيجا هرتز. إلى جانب البنية الدقيقة الجديدة 64 بت RISC وتحسينات بنية النظام، زادت أيضًا إنتاجية الحوسبة FP64 بأكثر من أربع مرات.


وفقًا للتقارير، يحتوي أكبر تكوين لـ Sunway OceanLight على أكثر من 100000 عقدة، بإجمالي أكثر من 41 مليون نواة موزعة في حوالي 105 خزانة. يتجاوز أداء ذروة نصف الدقة (FP16) 5 إكسافلوب/ثانية، ويبلغ أداء الذروة النظري لـ FP64 1.5 إكسافلوب، في المرتبة الثانية بعد الكمبيوتر العملاق American Frontier.



وفقًا لتقرير سابق صادر عن Thenextplatform، إذا تم توسيع نطاق Sunway Ocean Light إلى 120 كابينة، فإن قيمة الذروة تحت FP64pervision ستصل إلى 1.72 إكسافلوبس.وهذا من شأنه أن يتجاوز 1.68 إكسافلوبس للكمبيوتر العملاق "Frontier" التابع لمختبر أوك ريدج الوطني.

في حالة 160 كابينة، سيكون الأداء الأقصى لـ FP64 قريبًا من 2.3 إكسافلوب، والذي من المتوقع أن يتفوق على الكمبيوتر العملاق من الجيل الجديد "Aurora" المعتمد على وحدة المعالجة المركزية ووحدة معالجة الرسومات Intel في مختبر أرجون الوطني التابع لوزارة الطاقة الأمريكية، والكمبيوتر العملاق "El Capitan" المعتمد على رقائق AMDMI300 في مختبر لورانس ليفرمور الوطني الأمريكي قيد الإنشاء. سيصل أداء FP64 للأخيرين إلى أكثر من 2 إكسافلوب.