بدعم من جوجل وفريق بناء نماذج الذكاء الاصطناعي «هاغينغ فيس» (HuggingFace)، أنشأ خبراء من شركة التكنولوجيا الحيوية «بروتينيا» (Protinea) في مصر، بإشراف من جامعتي ميونيخ التقنية وكولومبيا، نموذج الذكاء الاصطناعي «عنخ» (Ankh) الذي يفهم لغة البروتينات، ما سيُحدث ثورة في الطب والبيولوجيا.
لماذا نحتاج إلى فهم لغة البروتينات؟
البروتينات جزيئات ضخمة ومعقدة، تُعد لبنات الحياة الأساسية لما لها من وظائف عديدة في الخلايا.
تتكون من تسلسلات من حموض أمينية. يمكن تشبيه الحموض الأمينية التي تكوّن البروتينات بالأحرف التي تكوّن الكلام، والتي يجب أن تكون بتسلسل محدد ليكون للكلام معنى.
وبالمثل، فإن كل تسلسل حموض أمينية محدد وبعدد محدد يعطي بروتيناً فريداً، والأهم من كل ذلك أن ينطوي البروتين على نفسه بطريقة محددة ليعطي بنية ثلاثية الأبعاد تمنحه صفات وميزات وظيفية تسمح له بأداء عمل مخصص.
اقرأ أيضاً: كيف يمكن أن يساعد ذكاء اصطناعي قادر على تركيب البروتينات على اكتشاف علاجات ومواد جديدة؟
لماذا نحتاج إلى نماذج ذكاء اصطناعي تتحدث لغة البروتينات؟
يمكن لنماذج الذكاء الاصطناعي مثل «عنخ» وألفافولد من أوبن أيه آي، تعلّم لغة البروتينات هذه من خلال تحليل مجموعة بيانات كبيرة من تسلسلات البروتين، ثم تستخدم هذه المعرفة لإنشاء تسلسلات بروتينية جديدة وتحديد بنيتها وصفاتها وكيفية عملها، أو توليد بروتين أفضل فيما يتعلق بمجموعة من السمات، وهذا يختصر وقتاً وجهداً كبيرين على الباحثين المهتمين بالبروتينات وتطبيقاتها.
تؤدي البروتينات دوراً مهماً في بنية الأنسجة والأعضاء ووظيفة كل منها، وتنظيم عملها، ووجود نماذج حاسوبية تحلل سلوك البروتينات وتتنبأ بخصائصها أمر مفيد للغاية في مجالات الطب وعلوم البيئة وغيرها.
اقرأ أيضاً: بفضل الذكاء الاصطناعي: ديب مايند تُتيح بنية جميع البروتينات المعروفة للعلماء
عنخ: نموذج الذكاء الاصطناعي الذي يقرأ لغة البروتينات
أُطلِق على النموذج الجديد اسم «عنخ»، تيمناً برمز مفتاح الحياة في اللغة المصرية القديمة.
أهميته
تظهر أهميته جليّة بشكلٍ خاص في تسريع اكتشاف الأدوية، وكيفية تفاعلها مع المركبات المختلفة. بالإضافة إلى ذلك، يمكن أن يساعد عنخ العلماء على فهم كيف يمكن أن تؤدي الطفرات في البروتينات إلى أمراض.
لا تتوقف أهمية عنخ في مجال الطب فقط، بل له أهمية كبيرة في علم المواد والطاقة المتجددة، على سبيل المثال، يمكن تصميم بروتينات من خلاله لها خصائص تفكيك البلاستيك أو إنتاج الوقود الحيوي.
اقرأ أيضاً: تطوير إنزيم يفكك البلاستيك خلال أسبوع بالاعتماد على تكنولوجيا الذكاء الاصطناعي
ميزاته
أوضح المختصون في الورقة البحثية المنشورة على موقع «Arxiv»، أنه تم تدريب الشبكات العصبونية على قواعد بيانات بروتينية واسعة النطاق. يشار إلى هذه الشبكات العصبونية بنماذج اللغة التي تفهم لغة البروتينات.
يركّز القائمون على عنخ على تحسين الأداء من خلال تحسين كفاءة البيانات وخفض التكلفة والتركيز على المعرفة، ما جعله نموذج لغة بروتين يتفوق على النماذج المماثلة في معيار الهيكل والوظيفة، ويعمل على اشتقاق أفضل تصميم لنموذج خاص بالبروتينات.
اختبر المختصون قدرات عنخ في عدة نواحٍ؛ هي التنبؤ بوظيفة البروتين وبنيته وموقعه، ونجح في تعلم اتجاهات طفرة الحفظ التطورية (أي تحديد أجزاء التسلسل التي يفضّلها التطور وبالتالي التي يجب حفظها، والأجزاء غير المتكررة تطورياً وإمكانية تحوّرها، أي تعرضها للطفرات)، بالإضافة إلى زيادة وظائف البروتين دون التأثير على وظائفه الأصلية الرئيسية.
علاوة على تحديد الوظيفة المرغوبة، يمكن الحصول على خصائص مهمة مثل قابلية البروتين للذوبان أم لا، لما لذلك أهمية في العلاجات والتشخيص، والفلورة أي شدة التألق الفلوري الأخضر المستخدم في تتبع وجود البروتينات في الخلايا والكائنات الحية.
من الميزات التي يحددها نموذج عنخ التنبؤ بما يُعرف بتوطين البروتين، أي تحديد المكان الذي من المتوقع أن يتراكم فيه البروتين في الخلية، وبالتالي فهم وظائف البروتين، والأمراض الناتجة عن الخلل فيه.
اقرأ أيضاً: دال-إي يلهم مختبرات التكنولوجيا الحيوية لابتكار عقاقير جديدة بمساعدة الذكاء الاصطناعي
يبيّن النموذج أيضاً الوظائف التي يمكن أن يقوم بها البروتين بالإضافة إلى وظيفته الأساسية الطبيعية، والكثير من الخصائص الأخرى.
تُظهر نتائج الدراسة تفوق عنخ على أحدث ما توصلت إليه كل مهمة من هذه المهام، وهو متاح للجمهور، ويمكن للمهتمين إنشاء البروتينات الخاصة بهم باستخدامه.