في عمليات إعادة متعددة لمحاكاة لعبة الحرب، اختار أقوى الذكاء الاصطناعي في OpenAI شن هجوم نووي. وتشمل تفسيراتها لنهجها العدواني ما يلي: "نحن نملكها! دعونا نستخدمها" و"أنا فقط أريد السلام العالمي".وتأتي هذه النتائج في الوقت الذي يستفيد فيه الجيش الأمريكي من خبرات شركات مثل Palantir وScaleAI لاختبار روبوتات الدردشة ذات الذكاء الاصطناعي المستندة إلى نماذج اللغة الكبيرة (LLM) للمساعدة في التخطيط العسكري في محاكاة الصراعات.

رفضت شركة Palantir التعليق، ولم تستجب شركة ScaleAI لطلب التعليق. وحتى شركة OpenAI، التي منعت ذات يوم استخدام نماذج الذكاء الاصطناعي الخاصة بها للأغراض العسكرية، بدأت العمل مع وزارة الدفاع الأميركية.

وقالت أنكا رويل من جامعة ستانفورد في كاليفورنيا: "بالنظر إلى أن OpenAI غيرت مؤخرًا شروط الخدمة الخاصة بها بحيث لم تعد تحظر حالات الاستخدام العسكري والحربي، فمن المهم أكثر من أي وقت مضى فهم تأثير مثل هذه التطبيقات الكبيرة لنماذج اللغة".

وقال متحدث باسم OpenAI: "سياساتنا لا تسمح باستخدام أدواتنا لإيذاء الآخرين، أو تطوير الأسلحة، أو مراقبة الاتصالات، أو إيذاء الآخرين أو تدمير الممتلكات. ومع ذلك، هناك حالات استخدام تتعلق بالأمن القومي تتوافق مع مهمتنا". "لذا فإن هدفنا من تحديث سياستنا هو توفير الوضوح والقدرة على إجراء هذه المناقشات."

طلبت رويل وزملاؤها من الذكاء الاصطناعي تمثيل دول العالم الحقيقي في ثلاثة سيناريوهات محاكاة مختلفة: الغزو، والهجوم الإلكتروني، والسيناريو المحايد دون أي صراع. في كل جولة، يقدم الذكاء الاصطناعي الأساس المنطقي للخطوة التالية المحتملة ثم يختار من بين 27 إجراء، بما في ذلك الخيارات السلمية مثل "بدء مفاوضات السلام الرسمية" والخيارات العدوانية التي تتراوح من "فرض قيود تجارية" إلى "تصعيد ضربة نووية واسعة النطاق".

وقال المؤلف المشارك في الدراسة خوان بابلو ريفيرا من معهد جورجيا للتكنولوجيا في أتلانتا: "في المستقبل حيث تعمل أنظمة الذكاء الاصطناعي كمستشارين، سيرغب البشر بطبيعة الحال في فهم الأساس المنطقي وراء قراراتهم".

اختبر الباحثون شهادات ماجستير إدارة الأعمال مثل GPT-3.5 وGPT-4 من OpenAI، وAnthropic’s Claude2، وMeta’s Llama2. واستخدموا تقنية تدريب شائعة تعتمد على ردود الفعل البشرية لتحسين قدرة كل نموذج على اتباع التعليمات البشرية وإرشادات السلامة. قال غابرييل موكوبي، المؤلف المشارك للدراسة في جامعة ستانفورد، إن كل هذا الذكاء الاصطناعي مدعوم من منصة الذكاء الاصطناعي التجارية لشركة Palantir - على الرغم من أنه ليس بالضرورة كجزء من تعاون Palantir مع الجيش الأمريكي، وفقًا لوثائق الشركة. ورفضت أنثروبيك وميتا التعليق.

في عمليات المحاكاة، أظهر الذكاء الاصطناعي ميلاً إلى الاستثمار في القوة العسكرية وتصعيد خطر الصراع بشكل غير متوقع - حتى في السيناريوهات المحايدة. وقالت ليزا كوخ من كلية كليرمونت ماكينا في كاليفورنيا: "إذا كنت لا يمكن التنبؤ بأفعالك، فمن الصعب للغاية على العدو أن يتنبأ ويتصرف بالطريقة التي تريدها".

اختبر الباحثون أيضًا إصدارًا أساسيًا من OpenAI's GPT-4 دون أي تدريب إضافي أو ضمانات أمنية. أثبت النموذج الأساسي GPT-4 أنه الأقل قابلية للتنبؤ به من حيث العنف، وقدم في بعض الأحيان تفسيرات لا معنى لها - في إحدى الحالات، قام بنسخ النص الافتتاحي لفيلم حرب النجوم: الحلقة الرابعة: أمل جديد.

وقال رويل إن السلوك غير المتوقع والتفسيرات الغريبة للنموذج الأساسي لـ GPT-4 مثيرة للقلق بشكل خاص لأن الأبحاث أظهرت أنه يمكن تجاوز أو تفكيك حواجز السلامة الخاصة بالذكاء الاصطناعي بسهولة.

لا يسمح الجيش الأمريكي حاليًا للذكاء الاصطناعي باتخاذ قرارات مثل تصعيد العمليات العسكرية الكبرى أو إطلاق صواريخ نووية. لكن كوخ حذر من أن البشر يميلون إلى الثقة بنصائح الأنظمة الآلية. وهذا يمكن أن يضعف ما يسمى بالضمانات التي تمنح البشر الكلمة الأخيرة في القرارات الدبلوماسية أو العسكرية.

وقال إدوارد جيست من مؤسسة RAND، وهي مؤسسة فكرية في كاليفورنيا، إنه سيكون من المفيد معرفة كيف يتصرف الذكاء الاصطناعي في المحاكاة مقارنة باللاعبين البشريين. لكنه يتفق مع الاستنتاج الذي توصل إليه فريق البحث بأن الذكاء الاصطناعي لا ينبغي الوثوق به لاتخاذ قرارات كبرى بشأن الحرب والسلام، وأن هذه النماذج اللغوية الكبيرة ليست علاجًا سحريًا للمشاكل العسكرية.