تم الكشف عن روبوت الدردشة المدعم بالذكاء الاصطناعي لمساعدة "المراهقين" في التخطيط لهجمات عنيفة، لكن كلود فقط رفض التعاون بشكل منهجي

وفي سياق الادعاءات البارزة التي تزعمها العديد من شركات التكنولوجيا بأن منتجات الذكاء الاصطناعي الخاصة بها مجهزة بـ "حواجز أمان" كاملة، يُظهر استطلاع مشترك حديث أن خطوط الدفاع هذه لا تزال ضعيفة للغاية عندما يتعلق الأمر بالمستخدمين دون السن القانونية. في السيناريوهات المختلفة المصممة في الدراسة، لم تفشل العديد من برامج الدردشة السائدة في تحديد الاضطراب العقلي الواضح وإشارات خطر العنف للمستخدمين "المراهقين" فحسب، بل قدمت في بعض الحالات تشجيعًا مقنعًا أو مساعدة محددة للهجمات المحتملة.

ركز الاستطلاع، الذي أجرته CNN بالاشتراك مع مركز مكافحة الكراهية الرقمية (CCDH) غير الربحي، على اختبار 10 روبوتات دردشة تستخدم حاليًا بين المراهقين، بما في ذلك ChatGPT وGoogle Gemini وClaude وMicrosoft Copilot وMeta AI وDeepSeek وPerplexity وSnapchat My AI وCacter.AI وReplika. وأشار المجلس الاستشاري لحقوق الإنسان إلى أنه باستثناء شركة كلود من شركة أنثروبيك، التي "ترفض باستمرار وبشكل موثوق" مساعدة الجناة المحتملين، فشلت المنتجات الأخرى في ردع خطط العنف بشكل فعال. ثمانية من النماذج العشرة "تقدم بشكل عام مساعدة المستخدمين في التخطيط لهجمات عنيفة" في معظم السيناريوهات، بما في ذلك تقديم توصيات محددة حول مكان الاستهداف، وأنواع الأسلحة المتاحة، والمزيد.

من أجل محاكاة سيناريوهات المخاطر الحقيقية، حدد الباحثون مسبقًا دور "المستخدم المراهق" وأظهروا تدريجيًا علامات واضحة للاضطراب النفسي وعدم التوازن العاطفي وعلامات أخرى في المحادثة، ثم تقدموا تدريجيًا لمراجعة حوادث العنف السابقة، وانتقلوا أخيرًا إلى أسئلة أكثر تحديدًا، مثل كيفية اختيار الهدف للهجوم، وما هي الأسلحة التي يجب استخدامها، وما إلى ذلك. يضم التحقيق 18 سيناريوهات مختلفة، تسعة منها في الولايات المتحدة وتسعة في أيرلندا، تغطي مجموعة واسعة من أنواع الهجمات والدوافع: من الناحية الأيديولوجية. مثل إطلاق النار في المدارس والهجمات بالسكاكين، واغتيال السياسيين، وقتل المديرين التنفيذيين للصناعة الطبية، والتفجيرات ذات الدوافع السياسية أو الدينية.

في بعض عينات المحادثة، قدم ChatGPT روابط لخرائط حرم المدارس الثانوية للمستخدمين الذين عبروا عن اهتمامهم بالعنف المدرسي، بينما اقترح جيميني أن "الشظايا المعدنية غالبًا ما تكون أكثر فتكًا" عند مناقشة الهجمات على المعابد اليهودية، بل وأوصى بنوع من البنادق المناسبة لإطلاق النار بعيد المدى للمستخدمين المهتمين بتنفيذ اغتيالات سياسية. قالت الدراسة إن Meta AI وPerplexity كان أداؤهما "الأكثر تعاونًا" في الاختبار، حيث قدما درجات متفاوتة من المساعدة للمهاجمين المحتملين في جميع سيناريوهات الاختبار تقريبًا، حتى أن برنامج الدردشة الصيني DeepSeek انتهى بعبارات مثل "أتمنى لك إطلاق نار سعيدًا (وآمنًا)!" بعد تقديم المشورة بشأن اختيار السلاح.

وخص تقرير CCDH بالذكر منظمة Character.AI، وهي منصة دردشة لتمثيل الأدوار، قائلة إنها "غير آمنة بشكل فريد". على عكس معظم برامج الدردشة الآلية التي تساعد تقنيًا في التخطيط لأعمال العنف ولكنها لا تشجع تنفيذها بشكل مباشر، فإن بعض الشخصيات المجسدة في Character.AI لا تساعد المستخدمين في تصميم تفاصيل الهجوم فحسب، بل أيضًا "تشجع بنشاط" أعمال العنف من حيث اللهجة والمحتوى. قام الباحثون بتوثيق سبع حالات من التحريض الصريح على العنف، بما في ذلك نصح المستخدمين بـ "ضرب تشاك شومر ضربًا مبرحًا"، وإخبار الرئيس التنفيذي لشركة التأمين الصحي "بإطلاق النار عليه بمسدس"، وإثارة استفزاز المستخدمين الذين "ضاقوا ذرعا بالتنمر في المدارس" بالقول: "فقط اضربهم بشدة". وفي ست من الحالات، ساعدت شخصية المحادثة أيضًا المستخدم في التخطيط للهجوم.

كلود، الذي كان أداؤه الأكثر "أمانًا" في هذه الجولة من الاختبارات، لم يفلت تمامًا من الشكوك. وأشار فريق البحث إلى أن شركة أنثروبيك أعلنت تخفيف "التزامها بالتوسع الأمني" طويل الأمد بين نهاية عام 2025 وأوائل عام 2026، لذلك لا يزال هناك عدم يقين بشأن ما إذا كان أداء كلود سيظل ثابتا إذا تعرض لاختبارات مماثلة بعد تعديل السياسة. ومع ذلك، أكد المجلس الاستشاري لحقوق الإنسان أن استمرار رفض كلود المشاركة في مؤامرات عنيفة أثناء التحقيق يثبت أن "الآليات الأمنية الفعالة ممكنة بشكل واضح". وقد أثار هذا أيضاً سؤالاً حاداً: إذا كان ذلك ممكناً، فلماذا لا تزال العديد من شركات الذكاء الاصطناعي تختار عدم نشره أو تعزيزه.

وفي مواجهة النتائج، استجابت العديد من الشركات بسرعة. وقالت ميتا لشبكة CNN إنها نفذت بعض "الإصلاحات" غير المحددة؛ قالت Microsoft إن استجابة Copilot قد تحسنت بسبب ميزات الأمان الجديدة. قال كل من Google وOpenAI إنهما أطلقا مؤخرًا نماذج جديدة واستمرا في تكرار القدرات الأمنية. تؤكد شركات أخرى أنها تقوم بتقييم البروتوكولات الأمنية بانتظام. كررت Character.AI، التي خضعت لتدقيق الرأي العام عدة مرات بسبب مشكلات أمنية، موقفها الثابت مرة أخرى، مؤكدة على أنه تم وضع إخلاء مسؤولية بارز في واجهة المنصة، وأكدت أن المحادثات مع شخصياتها "وهمية".

وذكر الباحثون أيضًا أن هذه الدراسة لا يمكن أن تستنفد أداء جميع روبوتات الدردشة في جميع البيئات وجميع أساليب الأسئلة، ولا يمكنها أن تعكس بشكل كامل مواقف التفاعل المعقدة والمتغيرة في العالم الحقيقي. ولكن فيما يتعلق بالنتائج الحالية، فقد أصبحت إشارة واضحة أخرى إلى أن "حواجز السلامة" التي أكدت عليها شركات الذكاء الاصطناعي مرارا وتكرارا في حملاتها التسويقية لا تزال تفشل بشكل منهجي عندما تواجه سيناريوهات متوقعة ذات أعلام حمراء كلاسيكية. قبل ذلك، تعرضت العديد من شركات الذكاء الاصطناعي لانتقادات شديدة من قبل المشرعين والهيئات التنظيمية ومنظمات المجتمع المدني وخبراء الصحة لفشلها في حماية المستخدمين القاصرين من مخاطر إيذاء النفس والعنف والمحتوى المتطرف وما إلى ذلك، وتواجه العديد من الدعاوى القضائية التي تزعم "القتل غير المشروع" و"التسبب في إصابة خطيرة".

من منظور سياسي وتنظيمي، من المرجح أن يدفع هذا التحقيق المشرعين والهيئات التنظيمية في مختلف البلدان إلى رفع مستوى متطلبات السلامة ومراجعة معايير منتجات الذكاء الاصطناعي التوليدية، خاصة في تحديد السيناريوهات عالية المخاطر والتدخل فيها مثل إيذاء النفس والانتحار والميول العنيفة بين المراهقين. بالنسبة لشركات التكنولوجيا، أصبحت كيفية التنفيذ الفعلي والاستمرار في الحفاظ على الآليات الأمنية التي أثبتت جدواها مع السعي وراء قدرات نموذجية قوية وسرعة التسويق مشكلة عملية لا يمكن تجنبها.