كيف يساهم الذكاء الاصطناعي في جعل الرعاية الصحية أكثر عدلاً؟

في السنوات القليلة الماضية، أظهرت الأبحاث أن أداء التعلم العميق يمكن أن يضاهي أداء الخبراء في مهام التصوير الطبي مثل الكشف المبكر عن السرطان وتشخيص أمراض العيون. لكن في المقابل، هناك ما يدعو لتوخي الحذر؛ حيث بيّنت أبحاث أخرى أن التعلم العميق ينطوي على نزعة إلى تكريس التمييز. وفي ظل نظام رعاية صحية يعج بالعديد من أوجه عدم المساواة، فإن التطبيقات غير المستقرة للتعلم العميق قد تؤدي إلى زيادة الطين بلة.

واليوم، تقترح ورقة بحثية جديدة نُشرت في مجلة نيتشر ميدسين (Nature Medicine) طريقةً لتطوير خوارزميات طبية قد تساعد في عكس -بدلاً من تكريس- الأوجه الحالية لعدم المساواة. ويقول زياد أوبرماير، الأستاذ المساعد في جامعة كاليفورنيا بيركلي الذي أشرف على البحث، إن الحل يكمن في التخلي عن تدريب الخوارزميات بغرض تحسين أدائها حتى يجاري أداء الخبراء البشر.

تبحث الورقة في مثال سريري محدد لجوانب عدم المساواة الموجودة في علاج التهاب مفصل الركبة، وهو داء يسبب ألماً مزمناً. يعتمد الأطباء على تقييم شدة هذا الألم من أجل اتباع العلاج المناسب الذي قد يشمل العلاج الطبيعي أو وصف الأدوية أو اللجوء إلى الجراحة. وعادة ما يتم إجراء ذلك بواسطة أخصائي أشعة يقوم بمراجعة صور الأشعة السينية لركبة المريض وتسجيل درجة ألمه على مقياس كيلجرين-لورنس (Kellgren-Lawrence) أو اختصاراً (KLG)، الذي يحسب مستويات الألم بناءً على وجود ميزات تصوير شعاعية مختلفة مثل درجة الغضروف المفقود أو حجم الأضرار الهيكلية.

بيد أن البيانات التي جمعها المعهد الوطني للصحة وجدت أن الأطباء الذين يستخدمون هذه الطريقة يمنحون بشكل ممنهج شدة ألم المرضى من ذوي البشرة السمراء درجة أدنى بكثير من شدة الألم الذي يقولون إنهم يعانون منه. يُبلغ المرضى ذاتياً عن مستويات الألم التي يشعرون بها باستخدام مسح يتضمن أسئلة عن درجة شعورهم بالألم أثناء قيامهم بأنشطة مختلفة مثل البسط الكامل لمفصل الركبة. ولكن عند تقرير العلاج المناسب، يتم تجاهل مستويات الألم المبلغ عنها ذاتياً لصالح الاعتماد على درجة مقياس (KLG) التي يحددها أخصائي الأشعة. وبعبارة أخرى، فإن المرضى ذوي البشرة السمراء يبلغون ذاتياً عن مستويات أعلى من الألم رغم أنهم يعانون من فقدان نفس القدر من الغضروف الذي يعاني منه المرضى ذوو البشرة البيضاء.

لطالما أثار هذا الأمر انزعاج الخبراء الطبيين. تقول إحدى الفرضيات إنه من الممكن أن المرضى ذوي البشرة السوداء يبلغون عن مستويات أعلى من الألم من أجل دفع الأطباء لعلاجهم بجدية أكبر. لكن هناك تفسير بديل؛ فربما تكون منهجية مقياس (KLG) في حدّ ذاتها متحيزة. لقد تم تطوير هذه المنهجية منذ عدة عقود بناءً على السكان البريطانيين ذوي البشرة البيضاء. ويرى بعض الخبراء الطبيين أن قائمة المؤشرات الشعاعية التي يتحقق الأطباء منها قد لا تشمل جميع المصادر الجسدية المحتملة للألم ضمن مجموعة سكانية أكثر تنوعاً. بعبارة أخرى، قد تكون هناك مؤشرات شعاعية للألم تظهر بشكل أكثر شيوعاً عند ذوي البشرة السمراء ولا تشكل ببساطة جزءاً من نموذج تقييم (KLG).

وفي مسعى للتحقق من صحة هذا الاحتمال، قام الباحثون بتدريب نموذج تعلم عميق على التنبؤ بمستوى الألم الذي يبلغ عنه المريض انطلاقاً من صور الأشعة السينية لركبته. فإذا كانت دقة النموذج سيئة للغاية، فسيعني هذا أن الألم المبلغ عنه ذاتياً يتسم بالعشوائية وعدم الدقة، أما إذا كان النموذج يتمتع بدقة جيدة حقاً، فسيوفر هذا دليلاً على أن الألم المبلغ عنه ذاتياً يرتبط فعلياً بالمؤشرات الشعاعية لصور الأشعة السينية.

بعد إجراء العديد من التجارب، بما في ذلك استبعاد أي عوامل إرباك، وجد الباحثون أن النموذج كان أكثر دقة من منهجية (KLG) في التنبؤ بمستويات الألم المبلغ عنها ذاتياً لكل من المرضى ذوي البشرة البيضاء والسمراء، مع دقة أعلى بشكل خاص عند المرضى ذوي البشرة السمراء. ونجح النموذج في تخفيض التمييز على أساس العرق عند كل مستوى من مستويات الألم بمقدار النصف تقريباً.

رغم أن هذا البحث لا يسعى بالضرورة إلى البدء في استخدام هذه الخوارزمية في بيئة سريرية، ولكن تفوق نموذج الذكاء الاصطناعي على منهجية (KLG) يكشف أن هناك خللاً في الطريقة القياسية المعتمدة لقياس الألم بما يضر بشكل أكبر بالمرضى من ذوي البشرة السمراء. ينبغي لهذا البحث أن يحث المجتمع الطبي على دراسة المؤشرات الشعاعية التي تكتشفها الخوارزمية، وتحديث المنهجية المتبعة لتسجيل مستوى الألم بناء على ذلك.

يقول أوبرماير: “في الحقيقة، هذا البحث يسلط الضوء على جزء مثير حقاً حول المراحل التي يمكن فيها إدماج هذا النوع من الخوارزميات ضمن عملية الاكتشاف الطبي. إنه يطلعنا على ما إذا كان هناك شيء هنا لا نفهمه لكن يستحق الدراسة والتمحيص، إنه يمهد الطريق للبشر للتدخل مستخدمين هذه الخوارزميات كأدوات بهدف محاولة فهم ما يحدث”.

تقول إيرين تشين، الباحثة في إم آي تي والتي تدرس كيفية الحد من تمييز خوارزميات التعلم الآلي في الرعاية الصحية ولم تشارك في البحث: “تكمن فائدة هذه الورقة البحثية في أنها تدفعنا إلى التفكير في الأشياء من منظور مختلف تماماً”. وتضيف أنه بدلاً من تدريب الخوارزمية بناءً على معرفة الخبراء الراسخة، اختار الباحثون التعامل مع التقييم الذاتي للمريض على أنه حقيقة. وباتباع طريقة التفكير هذه، كشف البحث وجود ثغرات كبيرة في ما يعتبره المجال الطبي عادة مقياساً “موضوعياً” للألم.

يوافق أوبرماير على ذلك قائلاً: “كان هذا هو جوهر بحثنا بالضبط”. ويضيف أنه إذا تم تدريب الخوارزميات لغرض واحد فقط يتمثل في الارتقاء بأدائها ليضاهي أداء الخبراء، فإنها ستعمل ببساطة على تكريس الفجوات القائمة وأوجه عدم المساواة. ويختم قائلاً: “تمثل هذه الدراسة لمحة عن نظام أكثر عمومية تتنامى قدرتنا على استخدامه في مجال الطب من أجل توليد معرفة جديدة”.