ووجد أحدث بحث أجرته هيئة الإذاعة البريطانية (بي بي سي) أن روبوتات الدردشة التي تعمل بالذكاء الاصطناعي لا تزال تعاني من أوجه قصور كبيرة في دقة التقارير الإخبارية، حيث يحتوي ما يقرب من نصف المحتوى الذي يتم إنشاؤه على أخطاء. وفقًا لتقرير تحليلي صدر بشكل مشترك من قبل هيئة الإذاعة البريطانية (BBC) و22 مؤسسة إعلامية عامة أوروبية أخرى، في 18 دولة و14 بيئة لغوية، عندما وصلت روبوتات الدردشة المدعمة بالذكاء الاصطناعي إلى محتوى المؤسسة الإخبارية وأجابت على الأسئلة ذات الصلة، احتوى حوالي 45% من إجاباتها على أخطاء.

لا تتضمن هذه الأخطاء الجمل غير الدقيقة والاقتباسات الخاطئة فحسب، بل تتضمن أيضًا مشكلات مثل المعلومات القديمة والأخطاء في الاقتباس وعدم تطابق المصدر. ويشير التقرير إلى أن روبوتات الدردشة غالبًا ما تقدم روابط لا تتطابق مع المصادر الفعلية المذكورة، وحتى عند الاستشهاد بالمواد بدقة، فإنها تفشل في التمييز بين الحقيقة والرأي، والسخرية من الأخبار المشروعة.

تعمل شركات التكنولوجيا الكبرى، بما في ذلك OpenAI وGoogle وMicrosoft وغيرها، بنشاط على الترويج لروبوتات الدردشة المنتجة للذكاء الاصطناعي ودمجها بعمق في منصات الإنترنت لمساعدة المستخدمين في الحصول على المعلومات وتحليلها تلقائيًا. على الرغم من أن المطورين يواصلون استثمار الكثير من الموارد للحد من ظاهرة "الهلوسة" (أي تصنيع محتوى الذكاء الاصطناعي)، إلا أن التقارير تظهر أن هذه المشكلة لا تزال صعبة الحل بشكل كامل على المدى القصير.

في الاختبارات الفعلية، واجهت العديد من أدوات الذكاء الاصطناعي السائدة، مثل ChatGPT وCopilot وGemini، أخطاء كبيرة. على سبيل المثال، يذكرون بشكل غير صحيح أن البابا فرانسيس لا يزال في منصبه، في حين أنه في الواقع قد خلفه ليو الرابع عشر. بل إن بعض منظمة العفو الدولية أبلغت بشكل صحيح عن تاريخ وفاة فرانسيس، لكنها ما زالت تصفه بأنه البابا الحالي. بالإضافة إلى ذلك، هناك معلومات قديمة وغير صحيحة عن المناصب القيادية ذات الصلة.

كما يوضح التقرير أن هذه المشاكل لا تقتصر على منطقة أو لغة واحدة، بل هي منتشرة في جميع أنحاء العالم. من بينها، يعد برنامج Gemini من Google هو الأقل دقة، حيث يحتوي ما يصل إلى 72% من ردوده على أخطاء كبيرة في المصدر. وقد أرجعت OpenAI سابقًا مثل هذه الأخطاء إلى حقيقة أن الإصدار المبكر تم تدريبه حتى سبتمبر 2021 فقط وفشل في الحصول على معلومات الإنترنت في الوقت الفعلي. ومع ذلك، فإنه لم يعد قابلا للتطبيق. لذلك، من المرجح أن تنبع المشكلة من الخوارزمية نفسها ويصعب علاجها من خلال تحديثات البيانات.

وعلى الرغم من انخفاض نسبة الأخطاء الجسيمة من 51% إلى 37% مقارنة باختبار بي بي سي المنفصل في فبراير من هذا العام، إلا أن جيميني لا يزال متخلفًا عن المنتجات الأخرى. على الرغم من النتائج الضعيفة، وجد الباحثون أن الجمهور البريطاني أظهر درجة عالية من الثقة في تلخيص الأخبار باستخدام الذكاء الاصطناعي: حيث يعتقد أكثر من ثلث البالغين البريطانيين وما يقرب من نصف الأشخاص الذين تقل أعمارهم عن 35 عامًا أن الذكاء الاصطناعي يمكنه تلخيص محتوى الأخبار بدقة. قال 42% من الجمهور إنه عندما يقوم الذكاء الاصطناعي بتحريف محتوى الأخبار الأصلي، فإنه سيشكك أيضًا في موثوقية المؤسسة الإخبارية نفسها أو يقلل الثقة فيها. ويحذر الخبراء من أن الشعبية المتزايدة لأدوات الذكاء الاصطناعي التوليدية يمكن أن تلحق ضررا خطيرا بسمعة ومصداقية المؤسسات الإخبارية الرئيسية إذا استمرت مثل هذه المشاكل.