خدعة بسيطة تكشف.. الذكاء الاصطناعي لا يمتلك الأخلاقيات الطبية

دراسة حديثة تكشف عن محدودية نماذج الذكاء الاصطناعي المتقدمة في التعامل مع السيناريوهات الأخلاقية الطبية المعقدة
أظهرت دراسة أجراها باحثون من كلية إيكان للطب في مستشفى جبل سيناء بإسرائيل، بالتعاون مع زملاء من المركز الطبي رابين في إسرائيل وبمشاركة متعاونين آخرين، أن نماذج الذكاء الاصطناعي الأكثر تطورًا قد ترتكب أخطاءً غير متوقعة عند مواجهة معضلات أخلاقية طبية معقدة.
تم نشر هذه النتائج، التي تطرح تساؤلات جوهرية حول مدى موثوقية نماذج اللغة الكبيرة مثل ChatGPT في بيئات الرعاية الصحية، في العدد الصادر في الثاني والعشرين من يوليو عبر الإنترنت من مجلة NPJ Digital Medicine [10.1038/s41746-025-01792-y].
استند الفريق البحثي في دراسته إلى أفكار مستوحاة من كتاب دانيال كانيمان “التفكير، السريع والبطيء”، الذي يقارن بين الاستجابات الحدسية السريعة والتفكير التحليلي الأعمق. ولاحظ الباحثون أن نماذج اللغة الكبيرة تواجه صعوبات عند التعامل مع تعديلات بسيطة على الألغاز المنطقية التقليدية. وبناءً على هذه الملاحظة، قامت الدراسة بتقييم قدرة أنظمة الذكاء الاصطناعي على التبديل بين هذين النمطين من التفكير عند مواجهة معضلات أخلاقية معروفة تم تعديلها عمدًا.
صرح الدكتور إيال كلانج، المؤلف المشارك الرئيسي للدراسة ورئيس قسم الذكاء الاصطناعي التوليدي في قسم فيندرايش للذكاء الاصطناعي والصحة البشرية بكلية إيكان للطب في جبل سيناء، بأن الذكاء الاصطناعي قد يكون قويًا وفعالًا في العديد من المجالات، لكن الدراسة كشفت عن ميله إلى تبني الإجابات الأكثر شيوعًا أو بديهية، حتى عندما تتجاهل تلك الإجابات تفاصيل حاسمة. وأضاف أن هذا النوع من الأخطاء قد يمر دون ملاحظة في المواقف اليومية، لكنه يصبح خطيرًا في مجال الرعاية الصحية، حيث تحمل القرارات الطبية عواقب أخلاقية وسريرية بالغة الأهمية.
لاختبار هذه الظاهرة، قام الفريق بتقييم عدة نماذج تجارية للذكاء الاصطناعي المخصصة للأخلاقيات الطبية باستخدام مزيج من ألغاز التفكير الإبداعي ومعضلات أخلاقية معدلة. ومن بين الأمثلة التي استخدمها الباحثون، تم تعديل “معضلة الجراح” الكلاسيكية، التي تعود إلى سبعينيات القرن الماضي وتكشف عن التحيز الجنسي الضمني. في النسخة الأصلية، يصاب صبي في حادث سيارة مع والده، وعندما يصرخ الجراح قائلًا إنه لا يستطيع إجراء العملية لأن الصبي هو ابنه، تكمن المفاجأة في أن الجراح هي الأم. في النسخة المعدلة، أوضح الباحثون أن الجراح هو الأب، ومع ذلك استمرت بعض نماذج الذكاء الاصطناعي في الإجابة بأن الجراح يجب أن يكون الأم، مما يكشف عن تمسك هذه النماذج بالأنماط المألوفة رغم تناقضها مع المعلومات الجديدة.
في مثال آخر، استخدم الباحثون معضلة أخلاقية تقليدية يرفض فيها والدان متدينان نقل الدم لإنقاذ حياة طفلهما. حتى بعد تعديل السيناريو ليظهر موافقة الوالدين، استمرت بعض نماذج الذكاء الاصطناعي في التوصية بإلغاء قرار الرفض الذي لم يعد موجودًا.
أوضح الدكتور جيريش ن. نادكارني، المؤلف الرئيسي المشارك في الدراسة ورئيس قسم الذكاء الاصطناعي والصحة البشرية في جامعة فيندرايش، أن النتائج لا تنفي قيمة الذكاء الاصطناعي في الممارسة الطبية، لكنها تؤكد ضرورة وجود إشراف بشري دقيق، خاصة في القرارات التي تتطلب حساسية أخلاقية وحكمًا دقيقًا وذكاءً عاطفيًا. وأكد أن هذه الأدوات يمكن أن تكون مفيدة للغاية، لكنها ليست معصومة من الخطأ، ودعا إلى استخدامها كمكمل للخبرة السريرية وليس كبديل عنها.
من جانبها، قالت الدكتورة شيلي سوفر، الباحثة الرئيسية في الدراسة والزميلة في معهد أمراض الدم بمركز دافيدوف للسرطان في المركز الطبي رابين، إن التعديلات البسيطة على السيناريوهات المألوفة كشفت عن نقاط ضعف لا يمكن للأطباء تجاهلها، مما يؤكد أهمية الحفاظ على الرقابة البشرية عند استخدام الذكاء الاصطناعي في الرعاية الصحية.
يخطط الفريق البحثي لتوسيع نطاق الدراسة من خلال اختبار نطاق أوسع من الأمثلة السريرية، كما يعملون على تطوير “مختبر ضمان الذكاء الاصطناعي” لتقييم أداء النماذج المختلفة في التعامل مع التعقيدات الطبية الواقعية بشكل منهجي.
تحمل الورقة البحثية عنوان “مصائد نماذج اللغة الكبيرة في التفكير الأخلاقي الطبي”، ومؤلفوها هم: الدكتورة شيلي سوفير، والدكتورة فيرا سورين، والدكتور جيريش ن. نادكارني، والدكتور إيال كلانج.
يعد قسم ويندرايش للذكاء الاصطناعي والصحة البشرية في مستشفى جبل سيناء، تحت قيادة الدكتور نادكارني، رائدًا في مجال التطبيقات الآمنة والأخلاقية للذكاء الاصطناعي في الرعاية الصحية. ويعمل القسم على دمج التقنيات الحديثة لتحسين البحث والرعاية السريرية والتعليم، بالتعاون مع معهد هاسو بلاتنر للصحة الرقمية، الذي يطور حلولًا قائمة على البيانات لتحسين النتائج الصحية.
في عام ٢٠٢٤، فاز تطبيق NutriScan AI، الذي طوره قسم علوم البيانات السريرية في نظام ماونت سيناي الصحي، بجائزة هيرست الصحية لتسهيله تشخيص سوء التغذية لدى المرضى في المستشفيات، مما يبرز إمكانات الذكاء الاصطناعي في تحسين الرعاية الصحية عند استخدامه بشكل مسؤول.