وفقا لصحيفة وول ستريت جورنال، فإن مجال الذكاء الاصطناعي يشهد تغيرا كبيرا، سيكون له تأثير عميق على شركات التكنولوجيا الكبيرة والصغيرة.على مدى السنوات الخمس الماضية، كان التركيز الرئيسي في مجال الذكاء الاصطناعي هو تدريب نماذج اللغات الكبيرة. وهذه عملية مكلفة تتطلب عشرات الآلاف من الرقائق، وتستهلك كميات هائلة من الطاقة، وتتم في مراكز بيانات كبيرة ونائية.تتطلب عملية التدريب هذه استخدام مجموعة من الآلاف من شرائح المعالجات الدقيقة المتخصصة لتغذية مليارات المعلومات (مثل تعريفات الكلمات، والحقائق التاريخية، والإحصاءات المالية، وصور القطط، وما إلى ذلك) في النموذج. تعمل مجموعات الرقائق 24 ساعة في اليوم، 7 أيام في الأسبوع لمدة أسابيع أو حتى أشهر.

الشكل 1: بدأ هوانغ رينكسون في التركيز على رقائق الاستدلال
من التدريب إلى الاستدلال
الآن، مع قيام المزيد من الشركات بنشر وكلاء الذكاء الاصطناعي ومحاولة تسويق أدوات جديدة مبنية على نماذج لغوية كبيرة، تحول التركيز إلى الاستدلال: نوع الحوسبة التي تسمح لنماذج الذكاء الاصطناعي المدربة بالرد على استفسارات المستخدم.
وفقًا لبيانات من شركة الأبحاث جارتنر، من المتوقع أن تتجاوز النفقات الرأسمالية العالمية على البنية التحتية للاستدلال (بما في ذلك الرقائق ومراكز البيانات وأجهزة الشبكات) النفقات الرأسمالية للتدريب لأول مرة هذا العام. بحلول عام 2029، ستنفق الشركات 72 مليار دولار على الاستدلال، أي ما يقرب من ضعف المبلغ الذي تم إنفاقه على التدريب والبالغ 37 مليار دولار.

سوف يتجاوز الإنفاق الاستدلالي التدريب
ويعني هذا التحول تغييرات كبيرة في أنواع الرقائق التي تشتريها شركات تكنولوجيا الرقائق. أصبحت Nvidia الشركة الأكثر قيمة في العالم من خلال بيع شرائح تسمى GPUs، والتي توفر قوة المعالجة الأولية اللازمة للتدريب على النماذج.لكن جاكوب فيلدجويس، الباحث الذي يدرس الذكاء الاصطناعي في جامعة جورج تاون، قال إن الشركات التي تتوقع القيام بالمزيد من أعمال الاستدلال يمكنها الحصول على مكاسب في الأداء باستخدام رقائق مُحسّنة لمهام الاستدلال.
وتشمل الشركات المصنعة المتخصصة في رقائق الاستدلال جوجل، وسيريبراس سيستمز، وسامبانوفا، وما إلى ذلك، وهي توقع طلبات تبلغ قيمتها مليارات الدولارات بمعدل متزايد. تستعد NVIDIA لإطلاق معالج خاص بها للاستدلال بعد إنفاق 20 مليار دولار أمريكي في ديسمبر من العام الماضي لترخيص تقنية شركة شرائح الاستدلال المخصصة Groq واستيعاب أفضل مواهبها.
إذًا، ما هي الحوسبة الاستدلالية بالضبط؟ وكيف تختلف عن الحساب المطلوب للتدريب؟ لماذا تحول الطلب إلى الاستدلال بهذه السرعة؟ ماذا يعني هذا بالنسبة للسوق؟
مبادئ الحساب الاستدلالي
يمكنك التفكير في الذكاء الاصطناعي كمطعم. النموذج هو الشيف. وبعد فترة من التدريب المكثف، وتعلم مئات أو حتى مليارات الوصفات وتقنيات الطهي، يصبح جاهزًا لبدء تلقي الطلبات.
المنطق هو التشغيل اليومي لهذا المطعم. يقدم العشاء طلبًا (عادةً في شكل سؤال إلى برنامج الدردشة الآلي)، ويقوم الشيف بإعداد الوجبة (يقوم برنامج الدردشة الآلي بإنشاء استجابة).

مبادئ المنطق
يتكون الاستدلال من مرحلتين، التعبئة المسبقة وفك التشفير. عندما يقوم المستخدم بإدخال الكلمة الفورية، تبدأ مرحلة ما قبل النشر، ويقوم النموذج بتفسير استعلام المستخدم من خلال معالجة كل كلمة أو رمز أو صورة فيه.
فك التشفير هو العملية التي يستخدم من خلالها النموذج كل ما تعلمه أثناء التدريب لإنشاء استجابة استعلام.
لهاتين المرحلتين من الاستدلال متطلبات مختلفة على الشريحة: تتطلب مرحلة ما قبل النشر المزيد من قوة المعالجة، بينما تتطلب مرحلة فك التشفير المزيد من الذاكرة، ويرجع ذلك جزئيًا إلى أنها يجب أن تحشد كل المعرفة المتراكمة من أجل تقديم "رموز" جديدة للمستخدم.
ما هي عناصر الكلمة؟
الرموز المميزة هي الوحدات الأساسية للبيانات المستخدمة لمعالجة الاستعلامات وإنشاء الاستجابات.
على الرغم من اختلاف نطاقات التحويل المقابلة لأنواع مختلفة من البيانات، فمن المعتقد بشكل عام أن عنصر الكلمة الواحدة يعادل حوالي ثلاثة أرباع الكلمة الإنجليزية. قم بإجراء استعلام بسيط عبر برنامج chatbot مثل "كيف حال الطقس اليوم؟" على سبيل المثال. سيقوم النموذج بتحليلها إلى ستة إلى ثمانية رموز.

عنصر الكلمة
عادةً ما يُنشئ النموذج وحدة كلمة واحدة في كل مرة، ويجب إخراج كل وحدة كلمة بالترتيب الصحيح لضمان أن تكون الإجابة سلسة ومعقولة.
في الوقت الحالي، الشركات التي تحاول تحقيق الدخل من أدوات الذكاء الاصطناعي، من برامج المحاسبة إلى خدمات حجز السفر إلى مولدات الصور، مهووسة بمقاييس التكلفة مثل "كلمة في الثانية لكل واط" أو "كلمة في الثانية لكل دولار".
وقال تيم برين، الرئيس التنفيذي لشركة تصنيع الرقائق GlobalFoundries، إن هذا يجعل قدرة رقائق الاستدلال على إخراج النتائج بكفاءة ذات أهمية خاصة. "اليوم، تخفيض تكلفة الاستدلال هو المفتاح."
الفرق بين شرائح التدريب والاستدلال
وبما أن التدريب يتطلب معالجة كميات هائلة من البيانات على مدى فترة طويلة من الزمن، فيجب أن تتمتع الشريحة المستخدمة بقدرات معالجة قوية، ويجب أن يتمتع مركز البيانات الذي توجد به الشريحة بإمكانية الوصول إلى ما يكفي من الطاقة والمياه لتبريد الشريحة. يتطلب التدريب أيضًا ذاكرة، ولكن إذا كانت ذاكرة وحدة معالجة الرسومات غير كافية، فيمكن تعيين بعض مهام المعالجة إلى شرائح أخرى أو انتظار تحرير الذاكرة الموجودة.
وفي المقابل، تتم عملية الاستدلال عند الطلب وتستغرق ثوانٍ وليس أسابيع. "لأكثر من عشر ثوانٍ، بدأ المستخدم بالفعل في النقر على شاشة الهاتف بإبهامه، استعدادًا للقيام بالشيء التالي." وقال رودريجو ليانج، الرئيس التنفيذي لشركة تصميم الرقائق SambaNova.
ولذلك، يجب أن تكون شرائح الاستدلال مجهزة بسعات أكبر من الذاكرة ذات النطاق الترددي العالي، ويجب أن تكون مراكز البيانات الخاصة بها قريبة من مجموعات المستخدمين لتقليل زمن الوصول. كما تتجه شركات الرقائق الناشئة مثل Ayar Labs بشكل متزايد إلى مكونات اتصال الألياف الضوئية، والتي يمكنها نقل البيانات بشكل أسرع من الكابلات النحاسية وتتطلب تبريدًا أقل.
وقال مارك ويد، الرئيس التنفيذي لشركة أيار لابز: "اليوم، كل شيء يتعلق بتوسيع نطاق الاستدلال".