- يوجد حالياً 6.3 مليون سجل تمت إزالة بياناتها التعريفية في قاعدة بيانات N3C التابعة للمعاهد الوطنية للصحة
- أصبحت إحدى أكبر مجموعات سجلات مرضى كوفيد في العالم
- يتلافى المشروع عدم توحيد أنظمة البيانات ومسائل الخصوصية التي تمثل معضلة لنظام الرعاية الصحية في الولايات المتحدة
طوال فترة الجائحة، كان هناك احتدام كبير بين ما يريد عامة الناس معرفته وما يستطيع العلماء قوله بشكل جازم.
تمكّن العلماء من معرفة أمور عن فيروس كورونا بشكل أسرع من أي مرض آخر عبر التاريخ، ولكن في نفس الوقت، تفاجأ الناس من عدم قدرة الأطباء على الإجابة عن بعض التساؤلات الأساسية، مثل: ما أعراض مرض كوفيد-19؟ وكيف ينتشر؟ ومن هم الأكثر عرضة للإصابة؟ وما أفضل طريقة لعلاجه؟
ولم يكن هذا التعارض أكثر وضوحاً مما هو عليه في الولايات المتحدة، التي تُنفق ما يقرب من خُمس ناتجها المحلي الإجمالي على الرعاية الصحية، ولكن النتائج التي تحققها في هذا المجال هي أسوأ من أي دولة غنية أخرى. كان التوصّل إلى إجابات لهذه الأسئلة معقداً ليس بسبب صعوبة الأمور العملية فحسب، بل لأن نظام الرعاية الصحية الأميركي يعتمد على خليط من الأنظمة القديمة غير المتوافقة.
ففي كافة أنحاء الدولة، تتداخل قوانين الخصوصية على مستوى الحكومات الفدرالية والولايات والمناطق، وتتعارض مع بعضها في بعض الأحيان. وفي الوقت نفسه، فإن السجلات الطبية مبعثرة وغير موحدة ومنفصلة عن بعضها بشدة تبعاً للمؤسسات التي تمتلكها؛ وذلك لأسباب تتعلق بالخصوصية ولأن بيع البيانات الطبية بعد إزالة المعلومات الشخصية منها هو أمر مربح جداً.
ولكن الوصول إلى هذه البيانات المنفصلة هو الطريقة الوحيدة للإجابة عن التساؤلات بخصوص مرض كوفيد. ولهذا السبب تم إجراء الكثير من الأبحاث المهمة في دول تتمتع بأنظمة رعاية صحية وطنية، على الرغم من أن الولايات المتحدة فيها عدد كبير جداً من مرضى كوفيد ومن المؤسسات البحثية. فعلى سبيل المثال، جاءت من المملكة المتحدة بعض البيانات القوية حول عوامل الخطر لوفيات كوفيد وبعض الخصائص مثل مرض كوفيد المزمن؛ إذ يمكن لباحثي الصحة العامة في المملكة المتحدة الوصول إلى البيانات الموجودة في 56 مليون سجل طبي لمرضى في هيئة الخدمات الصحية الوطنية.
في بداية الوباء، أدرك مجموعة من الباحثين الممولين من قبل المعاهد الأميركية الوطنية للصحة أنه من المستحيل الإجابة عن العديد من التساؤلات حول كوفيد-19 دون التخلص من العوائق التي تحدّ من مشاركة البيانات. ولذلك، قاموا بتطوير إطار عمل لجمع السجلات الحقيقية للمرضى من مؤسسات مختلفة بحيث تكون مفيدة وتؤمّن الخصوصية.
وكانت النتيجة هي المجموعة التعاونية الوطنية لكوفيد (N3C)، التي تعمل على جمع السجلات الطبية من ملايين المرضى في أنحاء الولايات المتحدة وتنظيفها والسماح بالوصول إليها للمجموعات التي تدرس كافة الجوانب من وقت استخدام جهاز التنفس الصناعي إلى كيفية تأثير كوفيد على الدورة الشهرية.
تقول ميليسا هيندل، أستاذة المعلوماتية البحثية في كلية أنشوتز للطب بجامعة كولورادو وإحدى الرؤساء المشاركين في مجموعة N3C: "من المروّع أنه لم يكن لدينا بيانات صحية تراكمية متّسقة للبحث فيها لمواجهة الوباء. لم نكن لنتمكّن أبداً من جعل الجميع يقدّم لنا هذا المستوى من البيانات دون وجود الوباء، ولكن قيامنا بذلك الآن هو إثبات على أن البيانات الطبية يمكن أن تكون متسقة وأن تتم مشاركتها على نطاق واسع بطريقة تضمن الأمان والشفافية".
تعدّ قاعدة البيانات تلك إحدى أكبر القواعد الحالية لسجلات كوفيد في العالم؛ حيث تحتوي على 6.3 مليون سجل طبي من 56 مؤسسة، والأرقام آخذة بالازدياد، بما فيها سجلات لـ 2.1 مليون مريض أصيبوا بالفيروس. تعود معظم السجلات إلى عام 2018، وقد تعهّدت المؤسسات المشاركة بتحديثها باستمرار لمدة 5 سنوات. وهذا ما يجعل مجموعة N3C إحدى أكثر المصادر فائدةً لدراسة المرض في الوقت الحالي، فضلاً عن كونها إحدى أكثر الوسائل الواعدة لدراسة مرض كوفيد المزمن.
لا يعدّ النظام الذي تقوم فيه المؤسسات بإرسال سجلات بكميات كبيرة إلى حكومة فدرالية مركزية أمراً معتاداً في نظام الرعاية الصحية في الولايات المتحدة. وإذا تم استخدامه بشكل جيد، فقد يتمكّن من الإجابة عن التساؤلات الدقيقة بعد فترة طويلة من الجائحة. وقد يكون إثباتاً على نجاح الفكرة والقيام بجهود مماثلة في المستقبل.
بيانات مفتوحة المصدر
لتقديم المعلومات إلى قاعدة البيانات، يتعيّن على مزودي الرعاية أولاً اختيار فئتين من المرضى، الأولى للمرضى الذين أصيبوا بمرض كوفيد والثانية للآخرين الذين سيكونون بمنزلة فئة شاهدة. يقومون بعد ذلك بإزالة كافة المعلومات الشخصية التي تمكّن من التعرّف على البيانات، باستثناء الرمز البريدي وتواريخ تلقي الخدمة، ثم نقلها بشكل آمن إلى مجموعة N3C. وهناك، يقوم الكادر التقني بمهمة تنظيف البيانات، التي لا تعدّ بالأمر السهل دائماً، وإدخالها إلى قاعدة البيانات.
يمكن لأي أحد أن يقدّم مقترحاً بحثياً عبرة منصة N3C، سواءً كان يتبع لإحدى المؤسسات التي تشارك المعلومات أم لا. وحتى العلماء الهواة يمكنهم طلب الوصول إلى نسخة لا تحتوي على بيانات تعريفية من مجموعات البيانات.
وتقوم لجنة من جامعة جونز هوبكنز بمراجعة كافة المقترحات واتخاذ القرار بشأن نسخة البيانات التي سيتمكن الباحثون من الوصول إليها. هناك عدة مستويات من المعلومات: مجموعة بيانات محدودة، ومستوى ثانٍ يحتوي على سجلات حقيقة تتضمن الرمز البريدي مع حجب التواريخ، ومستوى ثالث يتألف من سجلات "مركبة" تم إنشاؤها بواسطة الحاسوب في محاولة للحفاظ على نفس الخصائص دون أن تحتوي على بيانات حقيقية من المرضى. ويجب على الجميع الخضوع لتدريب على أمان البيانات قبل منح إمكانية الوصول.
تمت الموافقة حتى الآن على 215 مشروعاً بحثياً، بما في ذلك دراسات لتتبع مآلات المرضى الذين تلقوا لقاحات مختلفة لفيروس كورونا ولدراسة معدلات المضاعفات في العمليات الجراحية الاختيارية عند المرضى غير المصابين بمرض كوفيد أثناء الجائحة. وكانت أول دراسة منشورة اعتماداً على المجموعة التعاونية هي تحليل لعوامل خطورة الوفيات لدى مرضى السرطان الذين أصيبوا بفيروس كورونا، كما تم إصدار عدة تقارير أولية حول مواضيع مثل مآلات كوفيد عند المرضى المصابين بأمراض الكبد والمصابين بفيروس الإيدز.
مساءلة أكبر وعلوم أفضل
تعدّ البيانات النظيفة والدقيقة أمراً أساسياً لمثل هذه الدراسات، ولكن كان من الصعب التوصّل إلى ذلك وسط الأجواء الفوضوية التي أحدثتها الجائحة. في شهر يونيو الماضي، قامت اثنتان من المجلات العلمية الكبرى (المجلة الطبية البريطانية ولانست) بسحب أوراق بحثية اعتمدت على "بيانات" من شركة سورجيسفير، وهي شركة بيانات طبية ليست معروفة كثيراً ولديها عدد قليل من الموظفين. ادّعت الشركة وصولها إلى سجلات طبية في الوقت الحقيقي لما يقرب من 100 ألف مريض كوفيد في 700 مستشفى حول العالم. وفي بعض الحالات، كانت الأعداد تمثّل عدداً أكبر من المرضى الفعليين الذين تم تشخيص إصابتهم في بلد ما.
قبل سحب الأوراق البحثية، كانت قد أدت إلى قرارات لوقف التجارب السريرية وتعديل الإجراءات الطبية. ولكن عندما اعترى الباحثين الشك، وذلك بشكل أساسي لكون اتفاقية واحدة لنقل البيانات الطبية تتطلب الكثير من الوقت والعمل، رفضت الشركة أن تسمح لأحد بتدقيق البيانات. وفي الواقع، لا يوجد أي دليل على أن قاعدة البيانات موجودة على الإطلاق.
من ناحية أخرى، يمكن لمجموعة N3C أن تخضع للتدقيق والمساءلة من قبل آلاف الباحثين في مئات المؤسسات المشاركة، مع تركيز قوي على الشفافية وقابلية التكرار. كل ما يقوم به المستخدمون في الواجهة، التي تستخدم منصة بالانتيرز جوفكلاود، يتم حفظه بدقة، بحيث يمكن لأي شخص لديه إمكانية الوصول أن يقتفي أثر ذلك.
يقول كريستوفر شوت، أستاذ الطب بجامعة جونز هوبكنز والذي يشارك أيضاً في قيادة مجموعة N3C: "لا يعدّ هذا الأمر معقداّ أو جديداً، بل هو عمل جاد فقط. إنه أمر شاق، ويجب القيام به بدقة، وعلينا التحقق من صحة كل خطوة. إن أسوأ ما يمكن أن نقوم به هو تحويل البيانات بشكل منهجي إلى هراء من شأنه أن يعطينا إجابات خاطئة".
جهود هائلة
تشير هيندل إلى أن هذه الجهود لم تكن سهلة، وتقول: "إن الخبرات المتنوعة التي يتطلبها تحقيق ذلك، من مثابرة وتفانٍ وجهود هائلة، لم يسبق لها مثيل".
أتت تلك الجهود الهائلة من العديد من المجالات المختلفة وليس من المجال الطبي فقط.
تقول ماري بولاند، أستاذة المعلوماتية في جامعة بنسلفانيا: "إن مشاركة الجميع من كافة المجالات العلمية كانت أمراً مساعداً بالفعل. كان الأشخاص أكثر استعداداً للتعاون خلال جائحة كوفيد. يمكن أن يكون هناك مهندسون وعلماء كمبيوتر وعلماء فيزياء، وكل هؤلاء الأشخاص الذين قد لا يشاركون عادةً في أبحاث الصحة العامة".
تنتمي بولاند إلى إحدى المجموعات التي تستخدم بيانات N3C لدراسة ما إذا كان مرض كوفيد يزيد النزيف غير الطبيعي لدى النساء اللواتي يعانين من متلازمة المبيض متعدد الكيسات. وتقول إن معظم الباحثين في الأحوال العادية يستخدمون بيانات من شركات التأمين للحصول على قاعدة بيانات كبيرة بما يكفي لتحليلها على مستوى السكان.
فعلى سبيل المثال، يمكن لبيانات شركات التأمين الإجابة عن بعض التساؤلات بشأن فعالية الأدوية في الممارسات الحقيقة. لكن قواعد البيانات تلك ينقصها الكثير من المعلومات، بما فيها نتائج الاختبارات والأعراض التي يذكرها الناس وحتى البيانات المتعلقة بوفاة الأشخاص أو بقائهم على قيد الحياة.
جمع البيانات وتنظيفها
خارج قواعد بيانات شركات التأمين، تستخدم معظم مجموعات البيانات الصحية في الولايات المتحدة نموذجاً مركزياً. يوافق جميع المشاركين في تلك الدراسات على تنسيق مجموعات البيانات الخاصة بهم وفق تنسيق مشترك ثم تطبيق التساؤلات المنبثقة عن المجموعة، مثل نسبة حالات الإصابة الخطيرة بمرض كوفيد حسب الفئة العمرية. تعمل بهذه الطريقة العديد من مجموعات أبحاث كوفيد الدولية، بما فيها برنامج علوم المعلومات والبيانات الصحية من خلال الملاحظة (الذي يرمز له اختصاراً بـ OHDSI أو "أوديسي" لفظاً)، متجنبةً بذلك المشاكل القانونية والسياسية المتعلقة ببيانات المرضى العابرة للحدود.
تم تأسيس برنامج OHDSI عام 2014 ويضم باحثين من 30 دولة ويحتفظ بسجلات تعود لـ 600 مليون مريض.
تقول بولاند: "يسمح ذلك لكل مؤسسة بالاحتفاظ ببياناتها خلف جدران الحماية وتطبيق وسائلها الخاصة بها بحماية البيانات. ولا يتطلب نقل بيانات المريض بالاتجاهين. ويعدّ ذلك مطمئناً للعديد من الكيانات، وخاصة مع عمليات القرصنة التي تحدث مؤخراً".
لكن الاعتماد على كل مؤسسة لإعداد بياناتها الخاصة في مثل هذا النظام ينطوي على الكثير من المخاطر.
تقول بولاند: "يتمثل التحدي الأكبر في الحصول على البيانات وفق تنسيق مشترك؛ لأنه حتى أسماء الأدوية ليست موحدة في الحقيقة، رغم أنك قد تعتقد بأنها موحدة في جميع أنحاء الولايات المتحدة. غالباً ما توجد الأدوية في الصيدليات وفق تركيبها العلمي، إلا أنها قد تحتوي على مكونات مختلفة قليلاً بسبب قوانين براءات الاختراع. ولكل دواء من هذه الأدوية اسمه الخاص به".
من ناحية أخرى، تطلب مجموعة N3C من جميع الجهات المشاركة إرسال سجلاتها الأولية غير النظيفة إلى مكان واحد والسماح للجسم المركزي بتنظيفها وتوحيدها. وفي حين أن هناك العديد من الفوائد الواضحة، إلا أن هناك عقبات قانونية واجتماعية كبيرة أمام المشاركة بهذه الطريقة، سواءً في أميركا أو على الصعيد الدولي. فعلى سبيل المثال، لا يمكن للعديد من المؤسسات مشاركة بياناتها مع مجموعة N3C بسبب قوانين الخصوصية في ولاياتها.
كما أن ذلك يمثل تحدياً تقنياً؛ إذ يعدّ دمج مجموعتين من السجلات الطبية الإلكترونية أمراً صعباً للغاية ويتطلب الكثير من العاملين. وغالباً ما تكون جودة البيانات منخفضة مع القليل من البيانات الموحدة. وفي مؤسسات الرعاية الصحية متعددة المواقع، تكون خُمس السجلات الطبية تقريباً عبارة عن ملفات مكررة، وغالباً ما يعود ذلك إلى أخطاء في إدخال البيانات أثناء المواعيد أو القبول، وفقاً لورقة بحثية من مركز بيو للأبحاث عام 2018.
غالباً ما يدّعي المدافعون عن النماذج المركزية بأنها تقوم بإجراء مراقبة للجودة بأدواتها الخاصة بها خلف جدران الحماية. لكن الباحثين في مجموعة N3C اعترتهم الدهشة عندما اكتشفوا مدى فوضوية البيانات.
تقول هيندل: "كان هناك مقدار معين من الشك من المراكز، مثل قولهم بعدم الحاجة إلى هذا النوع من إجراءات جودة البيانات، فهم يقومون بذلك فعلاً في مراكزهم الخاصة بشكل سري وخلف جدران الحماية الخاصة بهم. وهم ليسوا في حاجة إلى أدواتنا التنسيقية المزعجة. لكننا أدركنا بأن مقاييس الجودة تلك غير كافية عند النظر إلى البيانات بشكل إجمالي".
تحدث بعض مشاكل جودة البيانات لأسباب تافهة.
يقول شوت: "في بعض الحالات، فشلت المؤسسات في وضع وحدات قياس. لذلك كان هناك وزن، لكن لم تكن هناك وحدة للقياس، كما لو كان من المفترض علينا أن نعرف". لكن وجود هذا العدد الهائل من السجلات منح المؤسسات ميزة إضافية، وسمح لها بحفظ العديد من وحدات البيانات التي كان من الممكن ألا تكون موجودة دون ذلك.
ويضيف: "لقد تمكنا من النظر في تفاصيل البيانات التي توجد لها وحدات لدينا، ومعرفة المكان المناسب للبيانات الغامضة. يمكنك أن تنظر إليها بشكل مباشر ليتضح أن الوحدة المقصودة هي رطل أو كيلوجرام".
لا يزال هناك الكثير لتحقيقه
على الرغم من ضخامة قاعدة بيانات N3C، إلا أنها تبدو صغيرة أمام البيانات التي يتم جمعها والاحتفاظ بها في الأماكن الأخرى في نظام الرعاية الصحية في الولايات المتحدة، من الوكالات الحكومية إلى المستشفيات والمختبرات وشركات التأمين وغيرها. تقوم وزارة الصحة والخدمات الإنسانية بتتبع أكثر من 2,000 مجموعة بيانات مرتبطة بالصحة، وذلك من الوكالات الفدرالية والحكومية والمحلية وحدها.
إن فائدة كل منها محدودة وحدها، فمن المستحيل على الباحثين الذين يعملون وحدهم أن يربطوا بين بيانات برنامج التأمين الصحي ميديكير وسجلات اللقاح والبيانات العرقية والإثنية المرتبطة باللقاحات في الولايات وقواعد البيانات المتخصصة بسلالات كوفيد-19 التي تم إجراء تسلسل لها في عينات المرضى في أنحاء الولايات المتحدة. وبالفعل، فإن تحويل السجلات الخام إلى معلومات مفيدة يمثل تحدياً كبيراً لدرجة أنه أصبح مجالاً تجارياً خاصاً؛ إذ يقوم وسطاء البيانات بشراء كميات كبيرة من سجلات تمت إزالة البيانات الشخصية منها وتحليل العلاقات بين المتغيرات وبيع نتائج التحليل أو البيانات بحدّ ذاتها إلى الباحثين والحكومات.
تقول هيندل: "نحن على استعداد لتقديم جميع بياناتنا إلى جهة تجارية والسماح لها ببيعها إلينا مرة أخرى، لكننا غير مستعدين للمشاركة بتكاليف أبسط البنى التحتية الأساسية للصحة العامة. يعدّ هذا الجهد التطوعي لمواجهة الوباء أمراً مذهلاً، لكنه ليس حلاً مستداماً طويل الأمد للتعامل مع الأوبئة في المستقبل أو مع الرعاية الصحية بشكل عام".
لا ينطوي نهج مجموعة N3C على بعض هذه المشاكل، ولكن هناك ثغرات كبيرة في بياناتها، ولا سيما في المعلومات المتعلقة باللقاحات؛ إذ يتم إعطاء معظم اللقاحات في مراكز مجتمعية، في حين أن سجلات المجموعة مأخوذة من زيارات مراكز الرعاية الصحية والمستشفيات؛ ما يعني أن هذه السجلات لا تشمل سوى 245 ألف لقاح فايزر و104 آلاف لقاح مودرنا. وتعمل شركة متخصصة بتحليل خدمات الرعاية الصحية على إنشاء أداة لجمع سجلات المرضى من مصادر متعددة بشكل آمن، ولكنها لن تكون متاحة قبل بضعة أشهر على الأقل.
وحتى مع هذه الثغرات، تقدّم قاعدة بيانات N3C الضخمة أحد أفضل المصادر المتاحة للباحثين الذي يتطلعون إلى إجابات على العديد من التساؤلات التي لم تتم الإجابة عنها بعد بخصوص كوفيد.
تقول هيندل: "هذا هو المكان الذي نحن عالقون فيه الآن. نحتاج حقاً إلى خبراء في جميع جوانب الرعاية السريرية المختلفة وإلى الأسس العلمية التي تدعمهم، وذلك لمساعدتنا في العثور على جميع الإبر في أكوام القش".
تمثل هذه المقالة جزءاً من مشروع تكنولوجيا الجائحة، الذي تدعمه مؤسسة روكفيلر.