قررت شركة ميتا (Meta) أن تُطلق مجموعة ضخمة من البيانات مع مجموعة من النماذج، تحمل اسم "أوبن ماتيريالز 2024" (Open Materials 2024) أو "أومات 24" (OMat24) اختصاراً، لمساعدة العلماء على استخدام الذكاء الاصطناعي في اكتشاف مواد جديدة بسرعة أعلى بكثير. تمثّل أومات 24 حلاً لأحد أكبر المعوقات التي تواجه عملية الاكتشاف، وهي البيانات.
كيف يعثر العلماء على مواد جديدة باستخدام الذكاء الاصطناعي؟
كي يعثر العلماء على مواد جديدة، يتعين عليهم إجراء عمليات حسابية تتعلق بخصائص العناصر الموجودة في الجدول الدوري، وإجراء عمليات محاكاة حاسوبية لتراكيبها المختلفة. يمكن لهذا العمل أن يساعدنا على اكتشاف مواد جديدة تتمتّع بخصائص يمكنها أن تفيدنا في تخفيف آثار التغير المناخي. على سبيل المثال، من خلال صُنع بطاريات أفضل أو أن تفيدنا في إنتاج أنواع جديدة ومستدامة من الوقود. لكن هذا العمل يتطلب مجموعات ضخمة من البيانات يصعب الحصول عليها. يتطلب بناء مجموعات البيانات هذه قدرات حاسوبية ضخمة، كما أنها عملية مكلفة للغاية. إضافة إلى ذلك، فإن ما يُميّز أفضل مجموعات البيانات والنماذج الموجودة حالياً، هو أن الكثير منها مملوك للشركات، ولا يمكن للباحثين الوصول إليه. وهذا هو الجانب الذي تأمل ميتا بأن تساعد فيه: فقد قررت الشركة أن تُطلق مجموعتها الجديدة الخاصة من البيانات مع نماذجها مجاناً، كما قررت أن تجعلها مفتوحة المصدر. ويمكن لأي شخصٍ أن يدخل إلى الموقع الإلكتروني لشركة هاغينغ فيس (Hugging Face) لتنزيل مجموعة البيانات والنماذج وتعديلها واستخدامها.
اقرأ أيضاً: آبل تدرس إمكانية التخلي عن عبارة «مرحباً سيري» واستبدالها بقدرات الذكاء الاصطناعي
يقول الباحث الرئيسي في مشروع أومات، لاري زيتنيك: "نحن نؤمن بشدة بأنه من خلال المساهمة في مجتمع علم المواد والاستفادة من نماذج البيانات المفتوحة المصدر، سيتمكن مجتمع علم المواد بأكمله من المضي قدماً وبوتيرة أسرع".
أومات 24: نموذج تعلم آلي من ميتا متخصص بعلوم المواد
يقول زيتنيك إن نموذج أومات 24 الجديد سيتصدر قائمة "ماتبينش ديسكفري" (Matbench Discovery) التي تصنف أفضل نماذج التعلم الآلي المستخدَمة في مجال علم المواد. كما أن مجموعة البيانات الخاصة بهذا النموذج ستكون أضخم مجموعة بيانات متاحة للاستخدام.
يقول أستاذ الهندسة النانوية في جامعة كاليفورنيا في مدينة سان دييغو، شيو بينغ أونغ، الذي لم يشارك في المشروع: "تشهد علوم المواد ثورة يقودها التعلم الآلي".
سابقاً، كان عمل العلماء يقتصر على إجراء حسابات دقيقة للغاية لخصائص المواد على أنظمة صغيرة للغاية، أو إجراء حسابات أقل دقة على أنظمة ضخمة للغاية، على حد قول أونغ. كانت هذه العمليات مضنية ومكلفة. غير أن التعلم الآلي ردم هذه الفجوة، حيث تسمح نماذج الذكاء الاصطناعي للعلماء بإجراء عمليات المحاكاة على تراكيب تجمع أياً من العناصر في الجدول الدوري بسرعة أكبر بكثير وبتكلفة أقل، على حد قول أونغ.
يقول أستاذ النمذجة الجزيئية في جامعة كامبريدج، غابور تشانيي، الذي لم يشارك في المشروع، إن قرار ميتا بجعل مجموعة البيانات الخاصة بها متاحة للجميع يتسم بأهمية أكبر من نموذج الذكاء الاصطناعي نفسه.
يقول تشانيي: "يتناقض هذا على نحو صارخ مع أسلوب الجهات الفاعلة الأخرى الكبيرة في هذا المجال، مثل جوجل ومايكروسوفت، اللتين نشرتا مؤخراً أيضاً نماذج تُظهر ميزات تنافسية ومدربة على مجموعات بيانات تتمتّع بالقدر نفسه من الضخامة لكنها سرية".
قررت ميتا، بغية إنشاء مجموعة البيانات أومات 24، أن تعتمد على مجموعة بيانات موجودة مسبقاً وتحمل اسم "ألكساندريا" (Alexandria) للحصول على عينات منها. بعد ذلك، أجرت مجموعة متنوعة من الحسابات وعمليات المحاكاة على ذرات مختلفة لتوسيع نطاق هذه المجموعة.
تتضمن مجموعة البيانات التي أنشأتها ميتا 110 ملايين نقطة بيانات تقريباً، أي أنها أضخم بعدة مرات من مجموعات البيانات السابقة. كما أن مجموعات البيانات الأخرى لا تتضمن بالضرورة بيانات عالية الجودة أيضاً، على حد قول أونغ.
اقرأ أيضاً: شركة ميتا تطور نماذج ذكاء اصطناعي جديدة تتحدث أكثر من ألف لغة
لماذا تُقْدم ميتا على هذه الخطوة؟
لقد تمكنت ميتا من توسيع مجموعة البيانات على نحو يتجاوز بكثير ما أنجزه مجتمع علوم المواد الحالي، وبدقة عالية، على حد قول أونغ.
يتطلب إنشاء مجموعات البيانات قدرات حسابية هائلة، وتمثّل ميتا إحدى الشركات القليلة التي تمتلك قدرات كهذه على مستوى العالم. يقول زيتنيك إنه ثمة دافع آخر لدى الشركة لتنفيذ هذا العمل: فالشركة تأمل باكتشاف مواد جديدة تجعل نظاراتها الذكية للواقع المعزز ميسورة التكلفة بدرجة أكبر.
يقول الأستاذ المساعد المختص بالهندسة الكيميائية وعلم المواد في جامعة مينيسوتا، كريس بارتل، الذي لم يشارك في عمل ميتا، إن الأعمال السابقة على قواعد البيانات المفتوحة، مثل تلك التي أنشأها "مشروع المواد" (Materials Project)، أدّت إلى إحداث تحول في علم المواد الحاسوبي على مدى العقد المنصرم.
وقد أظهرت الأدوات مثل أداة "غنوم" (GNoME) (وهو اختصار لعبارة "الشبكات الرسومية لاكتشاف المواد" [graphical networks for material exploration]) من جوجل أن إمكانية إيجاد مواد جديدة تزداد مع ازدياد حجم مجموعة التدريب.
يقول بارتل: "إن إصدار مجموعة البيانات أومات 24 للعموم هدية حقيقية لمجتمع علم المواد، ومن المؤكد أن هذه الهدية ستؤدي إلى تسارع فوري للأبحاث في هذا المجال".