يبين بحثٌ جديد كيف يمكن لمعالجة اللغات الطبيعية أن تساهم في تسريع الاكتشافات العلمية.
خلفية الخبر
شهدت معالجة اللغات الطبيعية تطورات كبيرة في السنوات الأخيرة، وذلك بفضل تطوير أساليب التعلم الآلي غير الموجه التي تحقق نتائج متميزة في اكتشاف العلاقات بين الكلمات؛ حيث تحصي تكرار الكلمات ومدى تقارب استخدامها بالنسبة لبعضها البعض، وتُنمذج هذه العلاقات في الفضاء ثلاثي الأبعاد. ويمكن استخدام هذه الأنماط بعد ذلك لفهم التشبيهات الأساسية مثل تشابه العلاقة بين كلمتي الرجل والملك من جهة وكلمتي المرأة والملكة من جهة أخرى، أو بناء الجمل وتشغيل أدوات مثل أنظمة الاستكمال الآلي للجمل والتنبؤ بالنصوص.
تطبيق جديد
قام بعض الباحثين باستخدام هذا الأسلوب لمسح 3.3 مليون ملخص في الأبحاث العلمية المنشورة ما بين 1922 و2018 في المجلات التي يُرجح أنها تحوي أبحاثاً في مجال علم المواد، وقد تمكنت العلاقات بين الكلمات من اكتشاف معلومات أساسية في هذا المجال، بما فيها بنية الجدول الدوري والعلاقة ما بين بنية المواد وخصائصها، وقد نُشر هذا البحث مؤخراً في مجلة Nature.
ونظراً لقدرة هذا الأسلوب على معالجة التشبيهات، فقد تمكن أيضاً من اكتشاف عدد من المركبات الكيميائية التي تحمل خصائص مماثلة للمواد الكهرحرارية، ولكنها لم تخضع للدراسة من قبل على هذا النحو. ويعتقد الباحثون أن هذا قد يمثل طريقة جديدة للتنقيب في الأبحاث العلمية الموجودة بحثاً عن ترابطات لم تُكتشف من قبل، وتسريع تقدم الأبحاث في مختلف المجالات.
أعمال ذات صلة
ليست هذه هي المرة الأولى التي تتمكن فيها مثل هذه الأساليب من اكتشاف علاقات مدهشة -بل ومذهلة- في كميات كبيرة من النصوص؛ ففي 2017 مثلاً، نُشر بحث في مجلة Science، استُخدمت فيه نفس الطريقة لمعالجة كمية ضخمة من النصوص على الإنترنت، ونجحت في محاكاة التحيزات التاريخية البشرية على أساس العرق والجنس، بل تمكنت حتى من حساب نسبة الرجال إلى النساء في اختصاصات مختلفة.
وتبين هذه الأبحاث غنى المعلومات حول هذا العالم ضمن اللغات البشرية، وقد أصبح بإمكاننا الحصول على هذه المعرفة بفضل أدوات التعلم الآلي.