ذكاء اصطناعي يتدرب على بياناتك الصحية من دون انتهاك خصوصيتك

3 دقائق

في 2017، نشرت جوجل على مدونتها – من دون ضجيج إعلامي – عن طريقة جديدة في التعلم الآلي. وخلافاً للنموذج المعتاد، والذي يتطلب تركيز البيانات في مكان واحد، يستطيع النموذج الجديد أن يتعلم من مجموعة من مصادر البيانات المتوزعة على عدة أجهزة. وقد سمح هذا الاختراع لجوجل بتدريب نموذجها لتوقع النص باستخدام جميع الرسائل المرسلة والمستقبلة من جميع مستخدمي أندرويد، من دون حتى قراءتها أو إزالتها من هواتفهم.

على الرغم من ذكاء هذه الطريقة، والمسماة التعلم الجمعي (أو الاتحادي أو الفيدرالي "federated learning")، فإنها لم تكتسب زخماً يذكر في ذلك الوقت في أوساط الذكاء الاصطناعي. ولكن هذا قد يتغير الآن، حيث ظهر تطبيق جديد لها في مجال مختلف تماماً، لأن هذه الطريقة التي تضع الخصوصية أولاً يمكن أن تمثل حلاً لأكبر المشاكل التي تواجه تطبيق الذكاء الاصطناعي في الرعاية الصحية حالياً.

يقول راميش راسكار، بروفسور مساعد مختص بعلوم الحاسوب في معهد إم آي تي، ويركز على أبحاث الذكاء الاصطناعي في المجال الصحي: "هناك فصل زائف ما بين خصوصية بيانات المرضى واستخدام هذه البيانات لصالح المجتمع. وفي الواقع، لا يدرك الناس أن الأمور تتغير من دون أن يدروا بذلك، وأننا أصبحنا الآن قادرين على تحقيق الخصوصية والاستخدام في الوقت نفسه".

على مدى العقد الماضي، أدى الصعود الكبير للتعلم العميق إلى تحول مذهل في الكثير من المجالات. فقد كان من الأدوات الأساسية في السيارات ذاتية القيادة، وأدى إلى تغيير طريقة تفاعلنا مع أجهزتنا، وتمكنا بفضله من إعادة صياغة أساليبنا في الأمن السيبراني. ولكن في الرعاية الصحية، وعلى الرغم من كل الدراسات التي أثبتت استخدامه الواعد في كشف وتشخيص الأمراض، فما زال التقدم في استخدام التعلم العميق لمساعدة المرضى الحقيقيين بطيئاً إلى حد مؤلم.

تتطلب أحدث الخوارزميات حالياً كميات هائلة من البيانات حتى تتعلم. وفي معظم الحالات، تكون زيادة هذه البيانات أمراً جيداً. وتحتاج المستشفيات والمؤسسات البحثية إلى جمع مخزوناتها من البيانات إذا أرادت الحصول على مجموعة ضخمة ومتنوعة بما يكفي حتى تكون مفيدة. ولكن فكرة وضع الكثير من البيانات بشكل مركزي في يد الشركات التكنولوجية –خصوصاً في الولايات المتحدة والمملكة المتحدة- أثبتت لعدة مرات، وبشكل متوقع، أنها مرفوضة إلى حد كبير.

ولهذا، بقيت أبحاث التشخيص باستخدام الذكاء الاصطناعي محدودة من ناحية المجال والتطبيق. فليس من الممكن تطبيق نموذج للكشف عن سرطان الثدي حول العالم إذا تم تدريبه باستخدام بضعة آلاف من المرضى من نفس المستشفى.

يمكن أن يتغير كل هذا باستخدام التعلم الجمعي. حيث تستطيع هذه الطريقة أن تدرب نموذجاً باستخدام بيانات مخزنة في عدة مستشفيات بدون أن تغادر هذه البيانات المستشفى أو تقترب حتى من مخدمات الشركة التكنولوجية، وتقوم بذلك عن طريق نماذج منفصلة لكل مستشفى باستخدام بياناته المحلية المتوافرة لديه أولاً، ومن ثم إرسال هذه النماذج إلى المخدم المركزي حتى تُجمع معاً في نموذج شامل. ومع حصول كل مستشفى على المزيد من البيانات بمرور الوقت، يمكن أن يقوم بتحميل أحدث نموذج شامل، وتحديثه باستخدام البيانات الجديدة، وإعادة إرساله إلى المخدم المركزي. وخلال هذه العملية، لا يتم على الإطلاق تبادل البيانات الخام، بل النماذج فقط، والتي لا يمكن تطبيق الهندسة العكسية عليها لكشف البيانات المستخدمة.

هناك بعض المشاكل التي تعترض التعلم الجمعي. فمثلاً، يمكن أن يؤدي جمع النماذج المنفصلة إلى نموذج شامل أسوأ من كل واحد من أجزائه. ويعمل الباحثون الآن على تحسين الطرق الموجودة لتجنب هذا الأمر، وفقاً لراسكار. كما أن التعلم الجمعي يتطلب وجود ما يلزم من البنية التحتية والعاملين لتدريب نماذج التعلم الآلي. هناك أيضاً مسألة توحيد أسلوب جمع البيانات في كل المستشفيات. ولكن، وكما يقول راسكار، فإن هذه المشاكل ليست عصية على الحل: "قد يتطلب النجاح بذل المزيد من الجهد، ولكنه إجمالاً عمل بسيط من ناحية المبدأ".

في الواقع، فقد ظهرت أساليب أخرى للتعلم الموزع الذي يهدف إلى الحفاظ على الخصوصية للتعامل مع هذه المشاكل. وعلى سبيل المثال، فقد ابتكر راسكار وطلابه مؤخراً أسلوباً يسمى التعلم المنفصل. وكما في حالة التعلم الجمعي، يبدأ كل مستشفى بتدريب نموذج منفصل خاص به. ولكن هذه النماذج لا تُدرب إلا جزئياً، وتُرسل بعد ذلك إلى المخدم المركزي حتى تُجمع وتنهي التدريب. الميزة الأساسية لهذه الطريقة أنها تريح المستشفيات من بعض أعباء الحوسبة. ما زالت هذه الطريقة في مراحلها الأولى، ولكن الاختبارات أظهرت أنها أدت إلى نموذج شامل يكاد يضاهي في دقته ما ينتج عن التدريب العادي باستخدام كامل مجموعة البيانات.

تعمل مجموعة من الشركات حالياً، بما فيها قسم الأبحاث في آي بي إم، على استخدام التعلم الجمعي لتطوير تطبيقات الذكاء الاصطناعي العملية في مجال الرعاية الصحية. كما تقوم الشركة الناشئة أوكوين في باريس، والتي تدعمها مؤسسة جوجل فينتشرز، باستخدام هذه الطريقة لتوقع مقاومة المرضى لأنواع مختلفة من العلاجات والعقاقير، إضافة إلى معدلات البقاء بوجود أمراض معينة. وتعمل الشركة مع عدة مراكز لأبحاث السرطان في الولايات المتحدة وأوروبا لاستخدام بياناتها في نماذجها. وقد أثمر هذا التعاون عن بحث سينشر قريباً، وفق المؤسسين، حول نموذج جديد يتوقع فرص النجاة للمصابين بنوع نادر من السرطان بناء على الصور المرضية. وسيشكل هذا البحث خطوة كبيرة نحو الأمام في إثبات فوائد هذه الطريقة في العالم الحقيقي.

يقول توماس كلوزيل، وهو طبيب متخصص في الأبحاث السريرية وأحد مؤسسي أوكوين: "أشعر بحماس شديد إزاء هذا العمل، لأن المعرفة تمثل أكبر عائق في علم الأورام حالياً. ومن المذهل أنه أصبح لدينا القدرة على استخلاص هذه المعرفة وتحقيق اكتشافات طبية هامة".

يعتقد راسكار أن تطبيقات التعلم الموزع قد تتجاوز الرعاية الصحية وتمتد إلى أية مجالات لا يرغب الناس فيها بمشاركة بياناتهم: "في بيئات موزعة وخالية من الثقة، ستكون هذه الطريقة فعالة للغاية في المستقبل".

المحتوى محمي