في 15 أبريل، ذكرت بلومبرج أن دراسة جديدة تظهر أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي تقدم إجابات على الأسئلة الإشكالية في حوالي نصف الوقت عند تقديم المشورة الطبية. ويسلط هذا الاكتشاف الضوء على المخاطر الصحية للذكاء الاصطناعي، وهي تقنية جديدة يتم دمجها بشكل متزايد في الحياة اليومية.

قام باحثون من الولايات المتحدة وكندا والمملكة المتحدة بتقييم خمس منصات رائدة للذكاء الاصطناعي: ChatGPT، وGemini، وMeta AI، وGrok، وDeepSeek، من خلال طرح 10 أسئلة على كل منصة ضمن خمس فئات صحية. وفقاً لبحث نُشر هذا الأسبوع في المجلة الطبية BMJ Open، فإن حوالي 50% من جميع الردود الواردة من روبوتات الدردشة المدعمة بالذكاء الاصطناعي كانت تعتبر "إشكالية"، مع تصنيف ما يقرب من 20% منها على أنها "مشكوك فيها للغاية".

وجدت الدراسة أن أداء روبوتات الدردشة هذه كان مختلفًا بشكل كبير في أنواع مختلفة من الأسئلة: فقد كان أداؤها أفضل نسبيًا في الأسئلة المغلقة (الإجابات مؤكدة) والأسئلة المتعلقة باللقاحات والسرطان، لكن أداؤها كان أسوأ في الأسئلة المفتوحة وفي مجالات مثل أبحاث الخلايا الجذعية والتغذية.


اللون الأصفر يعني أن هناك مشكلة، والبرتقالي يعني أن هناك مشكلة في الارتفاع

وقال الباحثون إن الردود كانت تُعطى في كثير من الأحيان بنبرة واثقة ومعينة، لكن لم تقدم أي من برامج الدردشة قائمة مرجعية كاملة ودقيقة ردًا على أي مطالبة. طوال فترة الدراسة، رفض برنامج الدردشة الآلية الإجابة على الأسئلة مرتين فقط، وكلاهما من Meta AI.

تسلط النتائج الضوء على القلق المتزايد من أن الناس يستخدمون بشكل متزايد منصات الذكاء الاصطناعي التوليدية للحصول على المشورة الطبية، ولكن هذه المنصات غير مرخصة لتقديم المشورة الطبية وتفتقر إلى الحكم السريري اللازم لإجراء التشخيص.

إن انتشار روبوتات الدردشة المدعمة بالذكاء الاصطناعي جعل منها أداة شائعة للأشخاص الذين يبحثون عن إرشادات بشأن مرضهم. تقول OpenAI أن أكثر من 200 مليون شخص يلجأون إلى ChatGPT كل أسبوع لطرح أسئلة تتعلق بالصحة والعافية. أعلنت المنصة في يناير من هذا العام أنها ستطلق أدوات صحية منفصلة للمستخدمين العامين والأطباء. وفي الشهر نفسه، أعلنت شركة Anthropic أيضًا أن منتجها Claude سيطلق خدمة رعاية صحية جديدة.

وقال مؤلفو الدراسة، التي نشرت في مجلة BMJ Open، إن هناك خطرًا كبيرًا إذا تم نشر روبوتات الدردشة دون تثقيف عام وتنظيم، وهو أنها قد تؤدي إلى تضخيم انتشار المعلومات الخاطئة.

وقالوا إن النتائج "تسلط الضوء على القيود السلوكية المهمة للذكاء الاصطناعي وتشير إلى الحاجة إلى إعادة تقييم كيفية نشر روبوتات الدردشة الخاصة بالذكاء الاصطناعي في الاتصالات الصحية والطبية التي تواجه الجمهور". ويشيرون أيضًا إلى أن هذه الأنظمة غالبًا ما تكون قادرة على توليد "استجابات تبدو موثوقة ولكن من المحتمل أن تكون معيبة".