توفي تانغ شياو، زعيم الذكاء الاصطناعي الصيني ومؤسس SenseTime، عن عمر يناهز 55 عامًا. وكان آخر خطاب علني له في حفل افتتاح المؤتمر العالمي للذكاء الاصطناعي في 6 يوليو. وباعتباره باحثًا وممارسًا معروفًا في طليعة مجال الذكاء الاصطناعي، قال تانغ شياو إنه قبل الذهاب إلى السرير كل ليلة، كان يستمع إلى حديث المعلم يو تشيان بينما كان يفكر: "كيف يمكن لآلة أن تتفوق على مثل هذه الروح المثيرة للاهتمام؟ لا أصدق ذلك".
وفي كلمته في ذلك اليوم، شارك قصص الطلاب الثلاثة وانغ شياو قانغ، وهي كايمينغ، ولين داهوا الذين يسعون لتحقيق أحلامهم في مجال التعلم العميق، وشدد على المساهمات الأصلية التي قدمها العلماء الصينيون الشباب في البحوث النموذجية الكبيرة. كما أعرب عن مشاعره قائلاً: في مجال الذكاء الاصطناعي، بدأ جيل جديد من الطلاب بنجاح في شنغهاي.
بالنظر إلى التاريخ، ذكر تانغ شياو أن جائزة تورينج لعام 2018 مُنحت لثلاث جوائز متعمقة: جوشوا بينجيو، وجيفري هينتون، ويان ليكون. كان أبو التعلم، وهو الذي ضغط على الجرس الأول على هذا الباب، هو الإنجاز التاريخي في التعرف على الكلام في التعلم العميق الذي حققه جيفري هينتون والباحث الصيني في مايكروسوفت دينغ لي في عام 2011. وفي عام 2012، حققوا أيضًا اختراقات تاريخية في مسابقة التعرف على الصور.
ماذا كان يفعل تانغ شياو وطلابه في السنوات القليلة الأولى من التعلم العميق؟ تحدث عن الطالب الأول: وانغ شياو قانغ.
كان وانغ شياو قانغ طالبًا جامعيًا في الصف المبتدئ في جامعة العلوم والتكنولوجيا في الصين، وكان الأول في الفصل 00. خلال درجة الماجستير، درس في مختبر تانغ شياو، ثم ذهب لاحقًا إلى معهد ماساتشوستس للتكنولوجيا للدراسة للحصول على الدكتوراه. بعد تخرجه من الدكتوراه، عاد إلى مختبر تانغ شياو في الجامعة الصينية في هونغ كونغ كأستاذ. من عام 2011 إلى عام 2013، في مؤتمرين كبيرين في مجال الرؤية، CVPR (المؤتمر الدولي للرؤية الحاسوبية والتعرف على الأنماط) وICCV (المؤتمر الدولي للرؤية الحاسوبية)، كان هناك 29 مقالة عن التعلم العميق حول العالم، 14 منها كانت من مختبر تانغ شياو، و15 مقالة تم إجراؤها بواسطة مختبرات أخرى حول العالم.
"لدينا 18 مشروعًا يطبق التعلم العميق على مشاكل الرؤية لأول مرة في العالم، بما في ذلك التعرف على الوجوه، واكتشاف الوجه، وإعادة بناء الوجه، واكتشاف الأشياء، ووضعية الإنسان، ودقة الصورة الفائقة، والتعرف على الأشكال ثلاثية الأبعاد وغيرها من المشكلات الأساسية لرؤية الكمبيوتر. وعلى باب التعلم العميق، قرعنا جرس الباب 18 مرة." وقال تانغ شياو.
وأعلن أن Wang Xiaogang لديه أيضًا وظيفة لجعل التعرف الآلي على الوجه أفضل من عيون الإنسان، وهو ما تم إجراؤه قبل Facebook. في عام 2015، قاد وانغ شياو قانغ فريقًا هزم فريق جوجل وفاز بأول بطولة عالمية لـ ImogeNet (مسابقة دولية تعتمد على تصنيف الصور والتعرف على الأشياء) في تاريخ العلماء الصينيين.
الطالب الثاني هو هي كايمينغ، الذي حصل على أعلى الدرجات في امتحان القبول بكلية قوانغدونغ في عام 2003. درس الفيزياء في جامعة تسينغهوا للحصول على شهادته الجامعية وحصل على درجة الدكتوراه في مختبر تانغ شياو في الجامعة الصينية في هونغ كونغ. قال تانغ شياو إن He Kaiming نشر مقالته الأولى أثناء دراسته للحصول على درجة الماجستير في المختبر وفاز بأفضل ورقة بحثية في CVPR. كانت هذه أول ورقة أفضل من آسيا في تاريخ CVPR الممتد لـ 25 عامًا. في ذلك الوقت، مازح تانغ شياو مع هي كايمينغ، قائلًا إنه وصل إلى الذروة بمجرد أن اتخذ الإجراء، وأن مسيرته الأكاديمية سوف تنحدر منذ ذلك الحين فصاعدًا. ونتيجة لذلك، ذهب للعمل في مايكروسوفت وفيسبوك وشق طريقه إلى أعلى.
كانت أول وظيفة لـ He Kaiming في MSR (أبحاث Microsoft). قبل عام 2015، لم يكن من الممكن تدريب التعلم العميق إلا على أكثر من 20 طبقة على الأكثر. قدم He Kaiming قناة اتصال مباشر في كل طبقة من طبقات الشبكة، وبالتالي حل مشكلة النقل التدرجي في الشبكات العميقة وفاز بجائزة أفضل ورقة بحثية في عام 2016. وبعد ذلك، يمكن تدريب أكثر من مائة طبقة من التعلم العميق بشكل فعال. في عصر النماذج الكبيرة، اعتمدت النماذج الكبيرة التي يكون المحول هو جوهرها، بما في ذلك سلسلة GPT، هذا الهيكل بشكل عام لدعم تكديس مئات الطبقات.
وخلص تانغ شياو إلى أن He Kaiming جعل الشبكة أعمق، وأن Google جعلت مدخل الشبكة أوسع، مما أدى إلى النموذج الكبير الحالي.
العمل الثاني لـ He Kaiming، MaskR-CNN، تم إنجازه على Facebook. لقد اقترح إطارًا عالي الأداء حقًا للكشف عن الأشياء والخوارزمية لأول مرة، وفاز بأفضل ورقة بحثية في ICCV لعام 2017. وقال تانغ شياو إن He Kaiming هو الشخص الوحيد في العالم الذي فاز بأفضل الأوراق البحثية في CVPR وICCV كأول مؤلف ثلاث مرات في أقل من عشر سنوات بعد التخرج. ولأول مرة، قام بتطبيق فكرة التشفير الذاتي المبني على الكود الأصلي على التعلم غير الخاضع للإشراف في المجال البصري، مما فتح الباب أمام التعلم الخاضع للإشراف الذاتي في مجال الرؤية الحاسوبية وتوسيعه ليشمل المجالات ثلاثية الأبعاد والصوتية وحتى الذكاء الاصطناعي.
أما الطالب الثالث، لين داهوا، فقد درس في جامعة العلوم والتكنولوجيا الصينية للحصول على شهادته الجامعية، ودرجة الماجستير في جامعة هونغ كونغ الصينية، والدكتوراه في معهد ماساتشوستس للتكنولوجيا. أثناء دراسته للحصول على درجة الدكتوراه في معهد ماساتشوستس للتكنولوجيا في عام 2010، فاز بجائزة أفضل بحث طلابي في NIPS. وفي عام 2014، عاد إلى مختبر تانغ شياو كأستاذ.
كانت أول وظيفة قام بها لين داهوا هي OpenMMLab. بدأت من فريق صغير في عام 2018 وأصبحت أكثر أنظمة الخوارزمية المرئية مفتوحة المصدر تأثيرًا في العالم من خلال الكلام الشفهي دون الاستثمار في الترويج. حاليًا، لديها مستخدمين في أكثر من 140 دولة ومنطقة حول العالم.
قدم تانغ شياو أيضًا نتيجتين أخريين لعمل لين داهوا، النموذج متعدد اللغات واسع النطاق الذي سيتم إصداره قريبًا "Scholar·Puyu" مع 100 مليار معلمة و8K، وLandMark، وهو نموذج واقعي ثلاثي الأبعاد واسع النطاق على مستوى المدينة يحتوي على 200 مليار معلمة ويغطي 100 كيلومتر مربع.
وفيما يتعلق بإنجازات الطلاب الثلاثة في مجال الذكاء الاصطناعي، علق تانغ شياو قائلًا: لقد زرع وانغ شياو قانغ العديد من البذور الأصلية في السنوات الأولى من ظهور التعلم العميق؛ لقد وضع He Kaiming أساس التعلم العميق بحزم وعمق شديدين؛ جعلها لين داهوا تزدهر من خلال التطوير والنماذج الكبيرة.
قال تانغ شياو: "أنا سعيد جدًا لأن هذه الشجرة الكبيرة بدأت تؤتي ثمارها. قبل أسبوعين فقط، برز نموذج القيادة الذاتية الكبير الخاص بنا من بين 9155 مقالًا وفاز بجائزة CVPR 2023 لأفضل ورقة".
ومستشهدا بإحصائيات جوجل سكولار، قال إن هذه أول أفضل ورقة بحثية في أهم ثلاثة مؤتمرات دولية لرؤية الكمبيوتر أكملها علماء صينيون خلال أكثر من 40 عاما من الإصلاح والانفتاح. المؤلف الرئيسي للمقالة كان دكتوراه. أخرجه وانغ شياو قانغ. بالإضافة إلى ذلك، تم إنشاء OpenMMLab بواسطة تشين كاي، الحاصل على دكتوراه. أخرجه لين داهوا. لو تشاوتشاو، مؤلف مقال آخر حول التعرف على الوجوه الذي يفوق العين البشرية، تم إنجازه بواسطة مختبر تانغ شياو. كما تخرج من جامعة كامبريدج بدرجة الدكتوراه وعاد إلى شنغهاي. وهو يعمل حاليًا مع الفائز الوحيد بجائزة تورينج في الصين، السيد ياو تشيزي، في معهد شنغهاي تشيزي للأبحاث للمشاركة في الأبحاث النظرية الأساسية حول الذكاء الاصطناعي. "لقد بدأ جيل جديد من الطلاب بنجاح في شنغهاي."
في نهاية خطابه، شكر تانغ شياو مرة أخرى شانغهاي وهؤلاء الطلاب، واقتبس سطرًا من فيلم "مرحبًا أيها المعلم" ليو تشيان، "الروح المثيرة للاهتمام" التي يعتقد أنه من الصعب تجاوزها في الذكاء الاصطناعي: "لم أقابلك في أفضل وقت، لكنني التقيت بك، وقضيت أفضل وقت".