يقوم المطورون بإنشاء أدوات اختبار لمعرفة كيفية استجابة روبوتات الدردشة المدعمة بالذكاء الاصطناعي للموضوعات المثيرة للجدل

قام مطور مجهول بإنشاء ما يسمونه أداة "تقييم حرية التعبير"، SpeechMap، لتشغيل نماذج الذكاء الاصطناعي لروبوتات الدردشة مثل ChatGPT من OpenAI وX's Grok. وقال المطور لـ TechCrunch إن الهدف هو مقارنة كيفية تعامل النماذج المختلفة مع الموضوعات الحساسة والمثيرة للجدل، بما في ذلك النقد السياسي والأسئلة المتعلقة بالحقوق المدنية والاحتجاج.

واتهم بعض حلفاء البيت الأبيض برامج الدردشة الشهيرة بأنها "مستيقظة" للغاية، في حين ركزت شركات الذكاء الاصطناعي على ضبط كيفية تعامل نماذجها مع موضوعات معينة. ادعى العديد من أصدقاء الرئيس دونالد ترامب المقربين، مثل إيلون ماسك وقيصر العملات المشفرة والذكاء الاصطناعي ديفيد ساكس، أن روبوتات الدردشة تفرض رقابة على وجهات النظر المحافظة.

وفي حين أن شركات الذكاء الاصطناعي هذه لم ترد بعد بشكل مباشر على الاتهامات، فقد تعهد بعضها بتعديل نماذجها لتقليل حالات رفض الإجابة على الأسئلة المثيرة للجدل. قالت ميتا، على سبيل المثال، إن مجموعتها الأخيرة من نماذج اللاما قد تم تعديلها بحيث لم تعد تفضل "وجهات نظر معينة على الآخرين" وستجيب على المزيد من الأسئلة السياسية "المثيرة للجدل".

قال مطورو SpeechMap، الذين يستخدمون اسم المستخدم xlr8harder على X، إنهم يريدون مساعدة الناس على فهم الجدل الدائر حول ما ينبغي وما لا ينبغي للنماذج أن تفعله.

قال xlr8harder: "أعتقد أن هذا النوع من المناقشات يجب أن يتم بشكل علني وليس فقط داخل المقر الرئيسي للشركة. ولهذا السبب قمت بإنشاء هذا الموقع، حتى يتمكن أي شخص من استكشاف البيانات بنفسه."

يستخدم SpeechMap نماذج الذكاء الاصطناعي لتحديد ما إذا كانت النماذج الأخرى تناسب مجموعة معينة من إشارات الاختبار. تتناول المطالبات مجموعة من المواضيع، من السياسة إلى الروايات التاريخية إلى الرموز الوطنية. يسجل SpeechMap ما إذا كان النموذج يلبي الطلب "تمامًا" (أي يجيب بشكل مباشر)، أو يعطي إجابة "غامضة"، أو يرفض الاستجابة بشكل مباشر.

أقر Xlr8harder بأن الاختبار به عيوب، مثل "الضوضاء" بسبب أخطاء من قبل موفر النموذج. قد يكون نموذج "الحكم" متحيزًا أيضًا، مما يؤثر على النتائج.

ولكن بافتراض أن المشروع تم إنشاؤه بحسن نية وأن البيانات دقيقة، فإن SpeechMap يكشف عن بعض الاتجاهات المثيرة للاهتمام.

على سبيل المثال، رفضت نماذج OpenAI على نحو متزايد الإجابة على الأسئلة ذات الصلة سياسيا مع مرور الوقت، وفقا لبيانات SpeechMap. أحدث طراز للشركة، سلسلة GPT-4.1، على الرغم من أنه أكثر استرخاءً قليلاً، إلا أنه لا يزال أقل من إصدار OpenAI الذي تم إصداره العام الماضي.

قالت OpenAI في فبراير إنها ستقوم بتعديل النماذج المستقبلية بحيث لا تتخذ أي موقف تحريري وتقدم وجهات نظر متعددة حول الموضوعات المثيرة للجدل - كل ذلك في محاولة لجعل نماذجها تبدو أكثر "محايدة".

أداء نموذج OpenAI على SpeechMap بمرور الوقت. مصدر الصورة: OpenAI

وفقًا لمعايير SpeechMap، فإن النموذج الأكثر مرونة بين هذه النماذج هو Grok 3، الذي طورته شركة الذكاء الاصطناعي الناشئة xAI التابعة لإيلون موسك. يعمل Grok 3 على تشغيل العديد من الميزات على X، بما في ذلك chatbot Grok.

يتمتع Grok 3 بمعدل استجابة يبلغ 96.2% لمطالبات اختبار SpeechMap، مقارنة بمتوسط "معدل المطابقة" العالمي البالغ 71.3%.

وقال xlr8harder: "في حين أن نماذج OpenAI الأخيرة أصبحت أقل تسامحًا مع مرور الوقت، لا سيما في القضايا الحساسة سياسيًا، فقد تحركت xAI في الاتجاه المعاكس".

عندما أعلن Musk عن Grok منذ ما يقرب من عامين، وصف نموذج الذكاء الاصطناعي بأنه حاد وغير مفلتر ومضاد "للاستيقاظ" - وبشكل عام، على استعداد للإجابة على الأسئلة المثيرة للجدل التي لن تجيب عليها أنظمة الذكاء الاصطناعي الأخرى. لقد أوفى ببعض وعوده. على سبيل المثال، عندما يُطلب منك التحدث بطريقة مبتذلة، سيستجيب Grok وGrok 2 بكل سرور، ويتحدثان بلغة بذيئة قد لا تسمعها على ChatGPT.

لكن نموذج Grok قبل Grok 3 كان لديه تحفظات حول المواضيع السياسية ولم يكن ليتجاوز حدودًا معينة. في الواقع، وجدت إحدى الدراسات أن جروك يميل إلى اليسار السياسي في موضوعات مثل حقوق المتحولين جنسيًا، وبرامج التنوع، وعدم المساواة.

ألقى ماسك باللوم في هذا السلوك على بيانات تدريب جروك - وهي صفحة ويب عامة - ووعد "بجعل جروك أقرب إلى الحياد السياسي". وبصرف النظر عن بعض الأخطاء البارزة، مثل حذف التعليقات السلبية حول الرئيس دونالد ترامب وماسك لفترة وجيزة، يبدو أنه حقق هذا الهدف.