نجحت شركة ديب مايند في تحقيق اختراق علمي غير مسبوق للتنبؤ بشكل البروتينات بالاعتماد على الذكاء الاصطناعي. وقد أعلنت الشركة يوم 30 نوفمبر الماضي أن نظام الذكاء الاصطناعي ألفا فولد (AlphaFold) تمكن من حل أحد أصعب التحديات في علم الأحياء والمعروف باسم مشكلة طي البروتين، الذي حيّر العلماء لمدة 50 عاماً؛ حيث استطاع ألفا فولد أن يتنبأ بدقة بشكل البروتين انطلاقاً من تسلسل الأحماض الأمينية المكوِّنة له. ومن شأن الإنجاز الجديد أن يقود إلى تقدم كبير في مجال فهم الأمراض واكتشاف وتطوير الأدوية في المستقبل.
مشكلة طي البروتين
البروتينات هي جزيئات كبيرة ومعقدة وتشكل اللبنات الأساسية للحياة وتدعم العمليات البيولوجية في كل كائن حي. وكل وظيفة يؤديها الجسم (مثل تقلص العضلات، واستشعار الضوء، وتحويل الطعام إلى طاقة) تعتمد تقريباً على البروتينات وكيفية تحركها وتغيرها.
حالياً، هناك حوالي 200 مليون بروتين معروف، ويتم اكتشاف 30 مليون بروتين تقريباً كل عام. وتتوقف مهمة كل بروتين وطريقة عمله على هيكله الفريد ثلاثي الأبعاد؛ حيث إن بروتينات الأجسام المضادة التي يستخدمها جهاز المناعة تأخذ شكل حرف (Y) يسمح لها بالالتصاق بالفيروسات والبكتريا، بينما تأخذ بروتينات الكولاجين شكل الحبال لتنقل الشدّ بين الغضاريف والأربطة والعظام والجلد، وهناك بروتين كاس9 (CAS9) المستخدم في تقنية كريسبر والذي يعمل كمقص لقطع ولصق أجزاء من الحمض النووي، والبروتينات المضادة للتجمد التي يسمح لها هيكلها ثلاثي الأبعاد بالارتباط ببلورات الجليد وحماية الكائنات الحية من التجمد.
يتألف البروتين من سلاسل -تشبه مسبحة من الخرزات- من المواد الكيميائية المختلفة المعروفة باسم الأحماض الأمينية. ويتم تجميع هذه السلاسل تبعاً للتعليمات الجينية الموجودة في الحمض النووي للكائن الحي. وتؤدي التفاعلات بين هذه الأحماض إلى طي البروتين؛ أي يأخذ شكلاً معيناً من بين مجموعة هائلة غير محدودة تقريباً من الأشكال الممكنة. وتكمن أهمية تحديد بنية البروتينات في أنه بمجرد فهم شكل البروتين، يمكن تخمين دوره داخل الخلية؛ ما قد يساعدنا في معالجة الأمراض وإيجاد أدوية جديدة بسرعة أكبر، بل ربما الكشف عن ألغاز الحياة نفسها.
لكن وفقاً لمفارقة ليفينثال، سيستغرق الأمر وقتاً أطول من عمر الكون المعروف لتعداد جميع التكوينات الممكنة لبروتين نموذجي بشكل عشوائي قبل التوصل إلى اكتشاف البنية ثلاثية الأبعاد الحقيقية للبروتين، ومع ذلك فإن البروتينات نفسها تقوم بعملية الطي تلقائياً وفي غضون أجزاء من الثانية. إن توقع كيفية طي هذه السلاسل في البنية ثلاثية الأبعاد المعقدة للبروتين هو ما يُعرف باسم "مشكلة طي البروتين".
وعلى مدى العقود الخمسين الماضية، كان العلماء يحاولون إيجاد طريقة موثوقة لتحديد بنية البروتين انطلاقاً من تسلسل الأحماض الأمينية المكوِّنة له. وقد تمكنوا من تحديد أشكال بعض البروتينات باستخدام تقنيات تجريبية مثل المجاهر الإلكترونية فائقة البرودة والرنين المغناطيسي النووي ودراسة البلورات بالأشعة السينية. لكن كل طريقة منها تنطوي على الكثير من التجربة والخطأ، ويمكن أن تستغرق سنوات من العمل، وتكلف عشرات أو مئات الآلاف من الدولارات لكل بنية بروتينية؛ ما يعني أننا لا نعرف البنية ثلاثية الأبعاد الدقيقة إلا لنزر يسير من البروتينات المعروفة.
لهذه الأسباب، وبفضل التقدم التكنولوجي الكبير خلال السنوات الأخيرة، توجّه العلماء إلى توظيف تقنيات الذكاء الاصطناعي كبديل لهذه العملية الطويلة والشاقة.
ديب مايند تستخدم التعلم العميق لحلّ مشكلة طيّ البروتين
بدأت ديب مايند التابعة لألفابت، الشركة الأم لجوجل، العمل على حل مشكلة طي البروتين منذ عام 2016، من خلال تطوير نظام الذكاء الاصطناعي ألفا فولد. واليوم، يقول باحثو ديب مايند إنهم اعتمدوا على التعلم العميق لتحسين أساليب النظام وتحقيق مستويات غير مسبوقة من الدقة. هذه الأساليب مستوحاة من مجالات علم الأحياء والفيزياء والتعلم الآلي، بالإضافة إلى عمل العديد من العلماء في مجال طي البروتين خلال نصف القرن الماضي.
انطوت أساليب ديب مايند على استخدام "نظام شبكة عصبونية قائمة على التركيز"، وهي شبكة عصبونية قادرة على التركيز على مدخلات معينة من أجل زيادة الفعالية. وتستطيع تحسين تنبؤاتها لكيفية طي البروتين انطلاقاً من تسلسل الأحماض الأمينية بالاعتماد على بيانات طي البروتينات المعروفة سابقاً. وقد قام الباحثون بتدريب الشبكة العصبونية لبضعة أسابيع على حوالي 170,000 بنية بروتين بالاعتماد على 16 وحدة معالجة تينسور (TPU)، أو ما يعادل ما بين 100 و200 وحدة معالجة رسومية.
وفي المحصلة، نجح نظام الذكاء الاصطناعي في إنتاج تنبؤات دقيقة للبنية الفيزيائية الأساسية للبروتين في غضون أيام. بالإضافة إلى ذلك، استطاع ألفا فولد التنبؤ بدرجة الثقة في كل جزء من البنية البروتينية المتوقعة باستخدام مقياس للثقة بهذه التوقعات.
نظام ألفا فولد يسجل أداءً مذهلاً في مسابقة كاسب
في عام 1994، أطلق جون مولت، عالم البيولوجيا الحسابية في جامعة ماريلاند، وأحد زملائه مسابقة كاسب (CASP) -اختصاراً للتقييم الدقيق للتنبؤ ببنية البروتين- التي تقام مرة كل سنتين وتهدف إلى تقييم أداء تنبؤات المجموعات البحثية لبنية البروتينات. وأي فريق يرغب في المشاركة بالمسابقة، يتلقى تسلسل الأحماض الامينية لبروتينات تم تحديد بنيتها تجريبياً لكن لم يتم نشرها بعد. ويتم منح الأشكال التي تتوقعها الفرق درجة من 100 بناء على مدى قرب المكان المتوقع لكل حمض أميني من موقعه الصحيح.
وفي مسابقة هذا العام (CASP14)، حقق نظام ألفا فولد درجة 87 في أصعب فئات المنافسة، وحقق درجة 92.4 في إجمالي الفئات، أي أنه نجح في التنبؤ بشكل ثلثي البروتينات وبمعدل خطأ لا يتجاوز 0.1 من النانومتر أو ما يعادل عرض الذرّة.
تطبيقات واعدة وأصداء واسعة لنظام الذكاء الاصطناعي ألفا فولد
لاقت أنباء نجاح ألفا فولد في حل تحدي طي البروتين ترحيباً واسعاً في أوساط خبراء الذكاء الاصطناعي وعلماء البيولوجيا على حدٍّ سواء؛ حيث قال مولت: "لقد ذُهلت حقاً عندما رأيت النتائج، إنها المرة الأولى التي نقترب فيها من تحقيق فعالية تقارب الأساليب التجريبية، وهو ما يمثل إنجازاً استثنائياً". وقال أندري لوباس من معهد ماكس بلانت للبيولوجيا التطورية، الذي كان يعمل على تحديد البنية الدقيقة لبروتين محدد لمدة عقد من الزمن: "من شأن هذا الإنجاز أن يغير وجه الطب، إنه أمرٌ مدهش فعلاً".
وقال إبراهيم المسلم، الأستاذ المساعد في المركز الوطني للذكاء الاصطناعي في مدينة الملك عبدالعزيز للعلوم والتقنية، في تغريدة له على تويتر إن نظام ألفا فولد يمثل نجاحاً كبيراً وسيساهم في تطوير صناعة الأدوية.
نجاح كبير للذكاء الاصطناعي في التنبؤ في شكل البروتين أحد أعقد تحديات علوم الأحياء. وظائف البروتينات تعتمد على هيكلتها، القدرة على معرفة الهيكلة سيساهم في تطوير صناعة الأدوية. سبق أن عملت عليها في الماجستير ٢٠٠٧ واذكر كلام مشرفي وقتها "اذا حليتها هذي نوبل جاهزة" https://t.co/d7UqYHXxri
— إبراهيم المسلَّم (@csibrahim) November 30, 2020
إن القدرة التي يتمتع بها نظام ألفا فولد على التنبؤ بأشكال البروتينات ستساعد في تسريع التقدم في العديد من المجالات البحثية المهمة. وعلى سبيل المثال، كانت المعلومات المحدودة عن بنية البروتين عائقاً رئيسياً أمام زيادة فهمنا لأمراض المناطق المدارية مثل مرض النوم (داء المثقبيات) والليشمانيا، التي تؤثر على حياة الملايين من الناس وتتسبب في عشرات الآلاف من الوفيات كل عام. كما أن مشكلة طي البروتين تعيق العديد من الجهود البحثية الأساسية؛ إذ قد يستغرق تطوير دواء جديد أكثر من 2.5 مليار دولار وأكثر من 10 سنوات من العمل. وهنا تبرز أهمية ألفا فولد أيضاً في المساهمة في اكتشاف الأدوية بشكل أسرع وأكثر كفاءة من خلال تحديد بنية العديد من البروتينات ذات الصلة بالمرض.
وعلاوة على ذلك، يمكن أن يساعد هذا النظام في إطلاق العنان لإمكانيات جديدة في مجال الاستدامة البيئية مثل إيجاد البروتينات والإنزيمات التي تكسر النفايات الصناعية والبلاستيكية أو تلتقط الكربون بكفاءة من الغلاف الجوي.
وقد عبر باحثو ديب مايند عن تفاؤلهم بالإمكانات الواعدة للنظام في مجال أبحاث البيولوجيا وغيرها من المجالات. وأكدوا أنهم يدرسون السبل الأفضل لإتاحة وصول أوسع إلى النظام. وختموا بالقول: "يمنحنا هذا التقدم مزيداً من الثقة في أن الذكاء الاصطناعي سيصبح أحد أكثر الأدوات فائدة للبشرية من خلال توسيع حدود المعرفة العلمية".