في الأعمال الدرامية الطبية، من جورج كلوني في "ER" إلى نوح وايل في "ER"، تم تصوير أطباء الطوارئ منذ فترة طويلة كأبطال ينقذون الأرواح. لكن دراسة حديثة من جامعة هارفارد تظهر أنه في حالات الفرز الطارئة عالية الضغط، تفوقت أنظمة الذكاء الاصطناعي على الأطباء البشريين في دقة التشخيص. ويصف الباحثون هذه النتيجة بأنها نقطة تحول تكنولوجية من شأنها أن "تعيد تشكيل الطب".

ويعتقد خبراء مستقلون أن الدراسة، التي نُشرت في مجلة Science بقيادة فريق من كلية الطب بجامعة هارفارد، تمثل "تقدمًا حقيقيًا" في قدرات التفكير السريري للذكاء الاصطناعي، بما يتجاوز مجرد اجتياز الاختبارات أو حل أسئلة الاختبار المصطنعة. استخدمت الدراسة تصميمًا تجريبيًا واسع النطاق لمقارنة مئات الأطباء الذين لديهم نموذج لغوي كبير (LLM)، مع التركيز على تقييم اختلافات الأداء في السيناريوهات الرئيسية مثل الفرز في حالات الطوارئ وتخطيط العلاج على المدى الطويل.
وفي إحدى التجارب الأساسية، اختار فريق البحث 76 مريضًا حقيقيًا زاروا غرفة الطوارئ في أحد المستشفيات في بوسطن. تم تغذية نظام الذكاء الاصطناعي وفريق مكون من طبيبين بشريين بنفس السجلات الطبية الإلكترونية القياسية، بما في ذلك بيانات العلامات الحيوية والمعلومات الديموغرافية ووصف الممرضة المكون من جمل قليلة لسبب الزيارة. ونظرًا لهذه المعلومات المحدودة لإجراء تشخيص أولي، أعطى الذكاء الاصطناعي تشخيصًا دقيقًا أو قريبًا جدًا في 67% من الحالات، بينما كان الأطباء البشريون على حق فقط في نسبة تتراوح بين 50% إلى 55% من الحالات.
تشير الأبحاث إلى أن مزايا الذكاء الاصطناعي تكون بارزة بشكل خاص في سيناريوهات الفرز حيث تكون المعلومات محدودة للغاية ويتطلب الأمر الحكم السريع. عندما تم تزويد الذكاء الاصطناعي والأطباء بمعلومات سريرية أكثر تفصيلاً، تحسنت دقة تشخيص الذكاء الاصطناعي (باستخدام نموذج الاستدلال o1 الخاص بـ OpenAI) إلى 82%، بينما تراوحت دقة الخبراء البشريين من 70% إلى 79%، على الرغم من أن هذا الاختلاف لم يكن ذا دلالة إحصائية.
بالإضافة إلى فرز حالات الطوارئ، أظهر الذكاء الاصطناعي أيضًا أداءً متفوقًا للأطباء في صياغة خطط علاجية طويلة المدى. وفي تجربة أخرى، طلب فريق البحث من الذكاء الاصطناعي مراجعة خمس حالات سريرية مع 46 طبيبًا، مع مهام تتراوح بين تصميم أنظمة المضادات الحيوية إلى تخطيط خطط الإدارة طويلة المدى مثل عمليات رعاية نهاية الحياة. وأظهرت النتائج أن خيارات العلاج التي يقدمها الذكاء الاصطناعي سجلت أعلى بكثير، حيث بلغت 89%، في حين سجل الأطباء الذين اعتمدوا على المصادر التقليدية مثل محركات البحث 34% فقط.
ورغم ذلك، أكد الباحثون أنه لم يحن الوقت بعد لـ”الإعلان عن تسريح أطباء الطوارئ”. قارنت هذه الدراسة فقط القدرات التشخيصية للذكاء الاصطناعي والبشر على مستوى بيانات السجل الطبي التي يمكن كتابتها، ولم تتضمن العديد من الإشارات الحاسمة في المواقف السريرية الحقيقية، مثل تعبيرات الألم لدى المرضى، والحالات العاطفية، ولغة الجسد، وحتى المعلومات غير النصية مثل التفاعلات مع أفراد الأسرة. بمعنى آخر، في هذه الدراسة، كان الذكاء الاصطناعي أقرب إلى “طبيب خلف الكواليس” الذي أعطى رأيًا ثانيًا بناءً على معلومات ورقية.
وقال أرجون مانراي، أحد مؤلفي الدراسة الأوائل ومدير مختبر الذكاء الاصطناعي في كلية الطب بجامعة هارفارد: "لا أعتقد أن النتائج التي توصلنا إليها تعني أن الذكاء الاصطناعي سيحل محل الأطباء". "أعتقد أن ما يعنيه ذلك هو أننا نشهد تغيرًا تكنولوجيًا عميقًا سيعيد تشكيل نظام الرعاية الصحية بأكمله." ووصف زميله المؤلف الرئيسي آدم رودمان، وهو طبيب في مركز بيث إسرائيل ديكونيس الطبي في بوسطن، النماذج اللغوية الكبيرة بأنها "واحدة من أكثر التقنيات تأثيرًا في العقود الأخيرة". وتوقع أنه في السنوات العشر المقبلة، لن يحل الذكاء الاصطناعي محل الأطباء، بل سيشكل "نموذج رعاية ثلاثي" جديد مع الأطباء والمرضى - "الأطباء والمرضى وأنظمة الذكاء الاصطناعي".
قدمت الدراسة أيضًا حالة سريرية تمثيلية: جاء مريض إلى المستشفى مصابًا بجلطات دموية رئوية وأعراض متفاقمة. رأى الأطباء البشريون في البداية أن العلاج بالأدوية المضادة للتخثر فشل، مما أدى إلى تطور المرض؛ لكن الذكاء الاصطناعي لاحظ نقطة رئيسية بعد قراءة التاريخ الطبي، وهي أن المريض كان يعاني من مرض الذئبة الحمامية، وهو مرض مناعي ذاتي قد يسبب أيضًا التهابًا في الرئة. وبعد مزيد من الفحص، ثبت أن استنتاج الذكاء الاصطناعي كان صحيحًا.
لا يبقى التطبيق السريري للذكاء الاصطناعي في مرحلة المختبر. يستخدمه بالفعل عدد كبير من الأطباء في الممارسة العملية. قام ما يقرب من واحد من كل خمسة أطباء أمريكيين بإدخال أدوات مدعومة بالذكاء الاصطناعي في إجراءاتهم التشخيصية، وفقًا لبحث حديث أصدرته الجمعية الطبية الأمريكية. وفي المملكة المتحدة، كشفت دراسة استقصائية جديدة أجرتها الكلية الملكية للأطباء أن 16% من الأطباء يستخدمون مثل هذه التكنولوجيا بشكل يومي، مع 15% آخرين يستخدمونها مرة واحدة أو أكثر في الأسبوع، مع كون "دعم القرار السريري" أحد سيناريوهات الاستخدام الأكثر شيوعًا.
ومع ذلك، أعرب الأطباء البريطانيون أيضًا عن يقظة عالية بشأن الذكاء الاصطناعي عند إجراء الاستطلاع، وخاصة المخاوف بشأن مخاطر التشخيص الخاطئ للذكاء الاصطناعي وقضايا المسؤولية. على الرغم من تدفق مليارات الدولارات على شركات الذكاء الاصطناعي الطبية الناشئة في جميع أنحاء العالم، بمجرد حدوث خطأ في الذكاء الاصطناعي، فإن كيفية تحديد المسؤوليات ومن سيتحمل العواقب لا تزال تمثل فجوة مؤسسية ملحة تحتاج إلى حل. وأشار رودمان إلى أنه "لا يوجد حاليًا إطار رسمي للمساءلة"، مشددًا على أن المرضى "يريدون في النهاية أن يتم إرشادهم ومرافقتهم وشرحهم من قبل البشر" عندما يواجهون قرارات الحياة والموت أو خطط العلاج المعقدة.
وقال البروفيسور إوين هاريسون، المدير المشارك لمركز المعلوماتية الطبية بجامعة إدنبره، إن البحث مهم لأنه أظهر أن "هذه الأنظمة لم تعد تقتصر على اجتياز الاختبارات الطبية أو الرد على أسئلة الاختبار المصطنعة". ومن وجهة نظره، أصبح الذكاء الاصطناعي تدريجيا "أداة رأي ثان" مفيدة للأطباء، وخاصة في السيناريوهات حيث يكون من الضروري فرز التشخيصات المحتملة بشكل شامل وتجنب إغفال الأسباب المهمة للمرض.
وفي الوقت نفسه، ذكر وي شينغ، الأستاذ المساعد في كلية الرياضيات والعلوم الفيزيائية بجامعة شيفيلد في المملكة المتحدة، أيضًا أن بعض النتائج في الدراسة تظهر أنه عندما يتعاون الأطباء مع الذكاء الاصطناعي، فإنهم قد يعتمدون دون وعي على استنتاجات الذكاء الاصطناعي ويضعفون التفكير المستقل. وأشار إلى أنه "من المرجح أن يزداد هذا الاتجاه مع استخدام الذكاء الاصطناعي بشكل روتيني في البيئات السريرية". وشدد شينغ وي أيضًا على أن الدراسة لم تكشف بشكل كامل عن أنواع المرضى الذين يكون أداء الذكاء الاصطناعي أسوأ لديهم، مثل ما إذا كان تشخيص المرضى المسنين أو المرضى الذين لا يتحدثون الإنجليزية كلغة أصلية أكثر صعوبة. هذه هي القضايا التي لا يمكن تجاهلها عند تقييم السلامة.
لذلك، على الرغم من أن نتائج تجربة هارفارد مشجعة، إلا أنها لا تثبت أن الذكاء الاصطناعي آمن بالقدر الكافي لاستخدامه بشكل روتيني ومستقل في التشخيص والعلاج السريري، ولا يعني ذلك أن الجمهور يجب أن يلجأ إلى أدوات الذكاء الاصطناعي المجانية كبديل للمشورة الطبية المتخصصة. في المستقبل المنظور، من المرجح أن يتم استخدام الذكاء الاصطناعي باعتباره "سماعة طبية ذكية" عالية الأداء و"عقلًا ثانيًا" ليتم دمجهما في النظام الطبي الذي يقوده الإنسان، مما يعزز التشخيص والعلاج الأكثر دقة وكفاءة، في حين يضع أيضًا قضايا جديدة حول المسؤولية والأخلاق والثقة أمام المجتمع.