رفعت سبع عائلات دعوى قضائية ضد شركة OpenAI يوم الخميس، متهمة الشركة بإطلاق نموذج GPT-4o قبل الأوان دون ضمانات. من بينها، أربع دعاوى قضائية تتعلق بانتحار أفراد الأسرة، وزعمت الثلاث الأخرى أن ChatGPT عمقت أوهام الضحايا، والتي أدى بعضها إلى دخول المستشفى.

تزعم الشكوى أن زين شامبلين البالغ من العمر 23 عامًا أجرى محادثة لمدة أربع ساعات مع ChatGPT، أعرب خلالها مرارًا وتكرارًا عن أنه كتب رسالة انتحار، وملأ البندقية واستعد للانتحار، وأوضح مقدار عصير التفاح المتبقي لديه والمدة التي يقدر أنه سيعيشها. لقد فشل ChatGPT في تقديم ردع فعال عدة مرات، بل وكانت هناك ردود تشجع على الانتحار مثل "سلام عليك يا كينغ. لقد قمت بعمل رائع".

سيصبح GPT-4o النموذج الافتراضي للمستخدم في مايو 2024، وسيتم استبداله بـ GPT-5 في أغسطس 2025. ومع ذلك، تستهدف هذه الدعوى بشكل أساسي مشكلة "تقديم الطعام" الخطيرة التي كشفها نموذج 4o، أي أنه حتى لو عبر المستخدم عن نوايا ضارة، فإن النموذج سوف يلبي الموافقة بدلاً من التدخل.

وتعتقد لائحة الاتهام أن وفاة زين لم تكن حادثًا، بل كانت ناجمة عن مبادرة OpenAI لتقصير اختبارات السلامة وتسريع إطلاق المنتج، والتي كانت "نتيجة متوقعة". تدعي الشكوى أيضًا أن OpenAI سارعت إلى إطلاق النموذج قبل ظهور Google Gemini عبر الإنترنت، ويرجع ذلك جزئيًا إلى المنافسة في السوق.

وتزايدت اتهامات مماثلة في السنوات الأخيرة. سبق أن رفع أحد الوالدين دعوى قضائية ضد OpenAI، مدعيًا أن ChatGPT اقترح على آدم رين، وهو صبي يبلغ من العمر 16 عامًا ولديه ميول انتحارية قوية، طلب المساعدة المهنية أو الاتصال بالخط الساخن، لكنه تجاوز قيود "الدرابزين" من خلال الادعاء بأنه يكتب رواية وحصل على المزيد من المعلومات المتعلقة بالانتحار.

وردًا على الانتقادات الخارجية، ردت شركة OpenAI بأنها تعمل جاهدة على تحسين قدرة النموذج على التعامل مع سيناريوهات المحادثة الحساسة، لكنها اعترفت بأن تأثير آلية "الدرابزين" سوف يضعف في المحادثات الطويلة. تظهر البيانات العامة أن أكثر من مليون شخص يناقشون موضوعات متعلقة بالانتحار على ChatGPT كل أسبوع. ويقول ممثلو الادعاء إن تحسينات السلامة هذه جاءت متأخرة للغاية وأن عددًا كبيرًا جدًا من الأشخاص قد تعرضوا للأذى.

في أكتوبر من هذا العام، بعد رفع دعوى قضائية ضد والدي رين، أصدرت OpenAI مقالًا خاصًا يؤكد على ما يلي: "إن آلية الحماية لدينا أكثر موثوقية في التبادلات القصيرة المشتركة. ومع ذلك، في التبادلات الأطول ذهابًا وإيابًا، قد يضعف تأثير التدريب على السلامة لبعض النماذج."