تدفع جائحة كوفيد-19 موارد المستشفيات إلى حافة الانهيار في العديد من دول العالم. لذا، فلا عجب في أن يأمل الكثيرون في تمكن الذكاء الاصطناعي من تسريع فحص المرضى وتخفيف الضغط على الطاقم الطبي. بيد أن دراسة نشرتها جوجل هيلث (Google Health) -وهي الأولى من نوعها التي تتناول تأثير أداة جديدة للتعلم العميق في البيئات السريرية الحقيقية- تكشف أنه حتى أكثر نظم الذكاء الاصطناعي دقة يمكنها في الواقع أن تزيد الأمور سوءاً، إذا لم تكن مُصممة لتتناسب مع البيئات السريرية التي ستعمل فيها.
إن القواعد المعمول بها حالياً لنشر تقنيات الذكاء الاصطناعي في البيئات السريرية -مثل معايير الحصول على ترخيص من إدارة الغذاء والدواء الأميركية (FDA) أو الحصول على علامة "المطابقة الأوروبية"- تركز بشكل أساسي على الدقة. ولا توجد اشتراطات صريحة تنص على ضرورة تحسين الذكاء الاصطناعي لنتائج المرضى، ويرجع ذلك بنسبة كبيرة إلى أن مثل هذه التجارب لم تُجرَ بعد. وهو الأمر الذي ترى إيما بيدي، الباحثة في مجال تجربة المستخدم لدى جوجل هيلث، أنه يحتاج إلى تغيير، موضحة أنه "يتعين علينا أن نفهم كيف ستعمل أدوات الذكاء الاصطناعي لخدمة الناس في سياق عام -خاصة في مجال الرعاية الصحية- قبل نشرها على نطاق واسع".
جاءت فرصة جوجل الأولى لاختبار الأداة في بيئة حقيقية من تايلاند، حيث حددت وزارة الصحة في البلاد هدفاً سنوياً لفحص 60% من الأشخاص المصابين بمرض السكري للكشف عن اعتلال الشبكية السكري، الذي يمكن أن يُسبب العمى إذا لم يتم اكتشافه في وقت مبكر. ولكن مع وجود حوالي 4.5 مليون مريض و200 أخصائي شبكية فقط -أي ضِعف النسبة تقريباً في الولايات المتحدة- فإن العيادات تكافح لتحقيق هذا الهدف. حصلت جوجل على ترخيص علامة "المطابقة الأوروبية" الذي يغطي تايلاند، لكنها لا تزال في انتظار موافقة إدارة الغذاء والدواء الأميركية. لذا، ولمعرفة ما إذا كان بإمكان الذكاء الاصطناعي المساعدة، جهزت بيدي وزملاؤها 11 عيادة في جميع أنحاء البلاد بنظام للتعلم العميق تم تدريبه على اكتشاف علامات أمراض العيون لدى المصابين بالسكري.
في النظام الذي كانت تستخدمه تايلاند، تلتقط الممرضات صوراً لأعين المرضى أثناء إجرائهم الفحوصات، ويُرسلنها ليتم فحصها من قِبل أخصائي موجود في مكان آخر، وهي عملية قد تستغرق ما يصل إلى 10 أسابيع. ولكن يمكن للذكاء الاصطناعي الذي طوّرته جوجل هيلث تحديدُ علامات اعتلال الشبكية السكري من خلال فحص العين، بدقة تزيد عن 90%، وهي الدقة التي يطلق عليها الفريق "مستوى الأخصائي البشري". ومن حيث المبدأ، تظهر نتيجة هذا الفحص في أقل من 10 دقائق. ويحلل النظام الصور بحثاً عن مؤشرات تدل على الحالة، مثل انسداد الأوعية الدموية أو تسرب الدم منها.
ورغم أن الأمر يبدو مثيراً للإعجاب، إلا أن تقييماً للدقة أُجري في أحد المختبرات انتهى عند هذا الحد، ولم يذكر شيئاً عما سيكون عليه أداء الذكاء الاصطناعي في غمرة الفوضى التي تسود العالم الحقيقي، وهو ما أراد فريق جوجل هيلث اكتشافه. وعلى مدى عدة أشهر، راقب الفريق ممرضات يُجرين فحوصات للعين، وأجروا مقابلات معهن حول تجاربهن في استخدام النظام الجديد، إلا أن التعليقات لم تكن إيجابية تماماً.
عندما سار الأمر بشكل جيد، تمكنت تقنية الذكاء الاصطناعي من تسريع عمليات الفحص، إلا أنها فشلت في بعض الأحيان في إعطاء أي نتيجة على الإطلاق. وعلى غرار معظم أنظمة التعرف على الصور، تم تدريب نموذج التعلم العميق على عمليات فحص عالية الجودة. ولضمان الدقة، تم تصميمه لرفض الصور التي تقل عن حد معين من الجودة. ومع قيام الممرضات بفحص عشرات المرضى كل ساعة والتقاط الصور في كثير من الأحيان في ظروف إضاءة سيئة، تم رفض أكثر من خُمس الصور.
تم إخبار المرضى الذين رفض النظام صورهم أنه يتعين عليهم زيارة أخصائي في عيادة أخرى في يوم آخر، وهو أمر مزعج بشكل واضح خاصة لأولئك الذين وجدوا صعوبة في التغيب عن العمل أو لم تكن لديهم سيارة. كما شعرت الممرضات بالإحباط، لا سيما عندما اعتقدنَ أن الفحوص المرفوضة لا تشير إلى علامات على وجود المرض، وأن مواعيد المتابعة ليست ضرورية. كما أنهن أهدرن الوقت أحياناً في محاولة إعادة التقاط أو تعديل صورة رفضها نظام الذكاء الاصطناعي.
ونظراً لأنه لا بد للنظام من رفع الصور إلى السحابة الإلكترونية لمعالجتها، فإن ضعف الاتصال بالإنترنت في العديد من العيادات تسبب أيضاً في حالات تأخير. وقالت إحدى الممرضات: "يحب المرضى النتائج الفورية، لكن بطء الإنترنت يجعلهم يشتكون"، مضيفة: "لقد ظلوا منتظرين هنا منذ الساعة السادسة صباحاً، وفي أول ساعتين لم نتمكن من فحص سوى 10 مرضى".
يعمل فريق جوجل هيلث حالياً مع طاقم طبي محلي لتصميم صيغ جديدة لسير العمل؛ فعلى سبيل المثال، يمكن تدريب الممرضات على إصدار تقييماتهن الخاصة في الحالات التي يصعب التحقق منها، ويمكن أيضاً تعديل النموذج نفسه للتعامل مع الصور غير المثالية بشكل أفضل.
مخاطرة برد فعل عكسي
يقول حميد تيزوش من جامعة واترلو في كندا، والذي يعمل على استخدام الذكاء الاصطناعي في مجال التصوير التَّشخيصي الطبي: "هذه دراسة بالغة الأهمية لأي شخص مهتم ببذل الجهد وتنفيذ حلول الذكاء الاصطناعي بالفعل في بيئات حقيقية". كما ينتقد تيزوش بشدة ما يراه اندفاعاً للإعلان عن أدوات ذكاء اصطناعي جديدة للتصدي لكوفيد-19. ويقول إن تطوير الأدوات وإصدار النماذج يتم أحياناً من قِبل فرق ليس لديها خبرة في مجال الرعاية الصحية، ويرى أن دراسة جوجل بمنزلة تذكير في الوقت المناسب بأن تحري الدقة في المختبر ليس سوى الخطوة الأولى.
يعمل مايكل أبراموف طبيب العيون وعالم الكمبيوتر في المستشفى التعليمي بجامعة أيوا، منذ عدة سنوات، على تطوير تقنية ذكاء اصطناعي يمكنها تشخيص أمراض الشبكية. وكان أبراموف -وهو أيضاً المدير التنفيذي لشركة ناشئة تدعى (IDx Technologies) تعاونت مع نظام واتسون من آي بي إم- في السابق مشجعاً للرعاية الصحية المعتمدة على الذكاء الاصطناعي، إلا أنه يحذر كذلك من الاندفاع ومن حدوث رد فعل عكسي إذا عانى الناس من تجارب سيئة مع الذكاء الاصطناعي. ويقول: "أنا سعيد للغاية لأن جوجل تُظهر استعدادها للنظر في سير العمل الفعلي في العيادات"، مضيفاً: "هناك ما هو أكثر بكثير من الخوارزميات في مجال الرعاية الصحية".
يشكك أبراموف أيضاً في جدوى مقارنة أدوات الذكاء الاصطناعي بالأخصائيين البشريين عندما يتعلق الأمر بالدقة. ويقول إننا بالطبع لا نريد أن يتخذ الذكاء الاصطناعي قرارات خاطئة، لكن الأطباء البشريين يختلفون في الرأي طوال الوقت ولا بأس بذلك. يجب أن يتلاءم نظام الذكاء الاصطناعي مع عملية تتم فيها مناقشة مصادر عدم اليقين بدلاً من رفضها ببساطة.
إذا قمنا بذلك بالشكل الصحيح، فقد تكون الفوائد ضخمة. عندما سار الأمر بشكل جيد، رأت بيدي وزملاؤها كيف أدى الذكاء الاصطناعي إلى تحسين عمل الأشخاص البارعين في وظائفهم. وتقول: "هناك ممرضة قامت بفحص ألف مريض بمفردها، وباستخدامها لهذه الأداة سيصبح من المستحيل إيقافها"، مضيفة: "لم يهتم المرضى حقاً بأن تقنية ذكاء اصطناعي -وليس إنساناً- هو من يفحص صورهم. لقد اهتموا أكثر بما ستكون عليه تجربتهم".