لماذا لا تحظى الأبحاث التطبيقية للتعلم الآلي بالاهتمام الذي تستحقه؟

من المرجح أن يكون أي باحث مهتمٍّ بتطبيق التعلم الآلي على مشاكل العالم الحقيقي قد تلقى استجابة من هذا القبيل: "يقدم المؤلفون حلاً لمشكلة أصلية ومحفِّزة للغاية، لكنه مجرد تطبيق، ويبدو أن أهميته محدودة بالنسبة لمجتمع التعلم الآلي".

لقد تم اقتباس هذه الكلمات مباشرة من مراجعة تلقيتها لورقة قدّمتها إلى مؤتمر نور آي بي إس (NeurIPS) (أنظمة معالجة المعلومات العصبية)، وهو المؤتمر الأهم في مجال أبحاث التعلم الآلي. لقد رأيت هذا النوع من الإجابات مراراً وتكراراً في مراجعات الأوراق البحثية التي قمت فيها وزملائي المؤلفين بتقديم أحد الأساليب المحفَّزة بالتطبيق، وسمعت قصصاً مماثلة من عدد لا يحصى من الباحثين الآخرين.

لقد دفعني ذلك إلى التساؤل التالي: إذا كان مجتمع التعلم الآلي يعتبر أن السعي إلى حل المشاكل شديدة التأثير في العالم الحقيقي باستخدام التعلم الآلي ذو أهمية محدودة، فما الذي نحاول تحقيقه إذن؟

يكمن الهدف من الذكاء الاصطناعي (ملف بي دي إف) في دفع حدود الذكاء الآلي وآفاقه إلى الأمام. وفي مجال التعلم الآلي، فإن إحراز تقدم جديد يعني عادةً تطوير خوارزمية أو إجراء جديد أو بنية شبكية جديدة في حالة التعلم العميق. وكما أشار آخرون، يقودنا هذا التركيز المُفرط على الأساليب الجديدة إلى كارثة جراء تراكم الأوراق البحثية التي تتضمن تحسينات هامشية أو تدريجية في مجموعات البيانات المعيارية وتعرض منح دراسية تشوبها العيوب (ملف بي دي إف) بينما يتسابق الباحثون لاحتلال صدارة القائمة.

وفي الوقت نفسه، فإن العديد من الأوراق البحثية -التي تعرض تطبيقات جديدة- تقدِّم أيضاً مفاهيم جديدة ونتائج عالية التأثير على حدٍّ سواء. ولكن يبدو أن مجرد التلميح لكلمة "تطبيق" يُفسد الورقة البحثية ويُفقدها قيمتها في نظر المراجعين. نتيجة لذلك، يتم تهميش أمثال هذا البحث في المؤتمرات الرئيسية. ويكمن الأمل الحقيقي الوحيد لمؤلفي هذه الأبحاث في أن يتم قبول أوراقهم في ورش العمل، التي نادراً ما تحظى بنفس الاهتمام من قِبل مجتمع التعلم الآلي.

يمثل هذا الأمر مشكلة لأن التعلم الآلي يحمل وعداً كبيراً بإحراز التقدم والنهوض في مجال الصحة والزراعة والاكتشاف العلمي وغيرها الكثير. لقد تم إنتاج أول صورة لثقب أسود باستخدام التعلم الآلي، كما يتم إجراء التنبؤات الأكثر دقة لبنى البروتين -وهي خطوة مهمة لاكتشاف الأدوية- باستخدام التعلم الآلي. ولو كان الآخرون في هذا المجال قد منحوا الأولوية لتطبيقات العالم الحقيقي، فما هي الاكتشافات الرائدة الأخرى التي كنا سنحققها حتى الآن؟

لا نفصح هنا عن معلومات جديدة؛ إليكم هذا الاقتباس من ورقة بحثية كلاسيكية بعنوان "التعلم الآلي المهم" (ملف بي دي إف)، لعالمة الحاسوب كيري واجستاف العاملة في ناسا: "فقدَت الكثير من أبحاث التعلم الآلي الحالية صلتها بالمشاكل التي تتمتع بأهمية كبرى بالنسبة للعالَم الأوسع في العلم والمجتمع". وفي نفس العام الذي نشرت فيه واجستاف ورقتها البحثية، فازت شبكة عصبونية ملتفة تسمى أليكس نت (AlexNet) في مسابقة رفيعة المستوى للتعرف على الصور تتمحور حول مجموعة بيانات إيماج نِت (ImageNet) الشهيرة، ما أدى إلى زيادة مفاجئة كبيرة في الاهتمام بالتعلم العميق. لسوء الحظ، يبدو أن الانفصال الذي وصفته واجستاف لم يزدد إلا سوءاً منذ ذلك الحين.

الأسئلة الخاطئة

إن تهميش الأبحاث التطبيقية سيؤدي إلى عواقب خطيرة؛ فعلى الرغم من الدور الرئيسي الذي تلعبه مجموعات البيانات المعيارية -مثل إيماج نت أو كوكو (COCO)- في تقدُّم التعلم الآلي من خلال تمكينها لتدريب الخوارزميات ومقارنة أدائها باستخدام نفس البيانات، غير أنها تحتوي على تحيزات قد يتم دمجها في النماذج الناتجة.

وعلى سبيل المثال، فإن أكثر من نصف الصور في ايماج نت (ملف بي دي إف) تأتي من الولايات المتحدة وبريطانيا العظمى. ويؤدي هذا الاختلال في التوازن إلى قيام الأنظمة بتصنيف الصور بشكل غير دقيق في فئات تختلف حسب المنطقة الجغرافية (ملف بي دي إف). وعلاوة على ذلك، تحتوي المجموعات الشهيرة لبيانات الوجوه -مثل قاعدة بيانات إي تي آند تي (AT&T) للوجوه- على وجوه الذكور ذوي بشرة فاتحة في معظمها، ما يؤدي إلى تطوير أنظمة تواجه صعوبات كبيرة في التعرف على وجوه الإناث أو الأشخاص ذوي البشرة الداكنة.

بينما يحاول الباحثون التفوق على بعضهم البعض في معايير مصطنعة، فإن واحداً من كل تسعة أشخاص حول العالم يتضور جوعاً.

عندما يتم استبعاد الدراسات حول التطبيقات الواقعية للتعلم الآلي من الاتجاه السائد، يغدو من الصعب على الباحثين أن يلمسوا تأثير نماذجهم المتحيزة، ما يقلل من احتمال قيامهم ببذل الجهود من أجل حل هذه المشاكل.

قد يعود أحد أسباب تقليص الأبحاث التطبيقية إلى اعتقاد الآخرين في مجال التعلم الآلي أن هذا العمل ينطوي ببساطة على تطبيق الأساليب الموجودة بالفعل. لكن في الواقع، فإن تكييف أدوات التعلم الآلي مع مشاكل محددة في العالم الحقيقي يتطلب عملاً خوارزمياً وهندسياً كبيراً. وغالباً ما ينتهي المطاف بالباحثين في مجال التعلم الآلي -الذين يفشلون في إدراك هذه الحقيقة ويتوقعون أن ينجحوا باستخدام الأدوات "الجاهزة"- بإنشاء نماذج عديمة الجدوى. فإما يقيِّمون أداء النموذج باستخدام مقاييس لا تعبّر عن تأثيره في العالم الحقيقي، أو يختارون الهدف الخاطئ تماماً.

وعلى سبيل المثال، تحاول معظم الدراسات التي تطبق التعلم العميق لتحليل تخطيط القلب أن تتفوق على قدرة الطبيب على التنبؤ بالمرض. لكن توقع وظائف القلب الطبيعية (ملف بي دي إف) سيوفر في الواقع لأطباء القلب المزيد من الوقت من خلال تحديد المرضى الذين لا يحتاجون إلى خبراتهم. كما تهدف العديد من الدراسات التي تطبِّق التعلم الآلي في زراعة الكروم إلى أَمثَلة مردود العنب (ملف بي دي إف)، لكن صانعي النبيذ "يريدون الحصول على المستويات الصحيحة من السكر والحمض في حبات العنب، وليس فقط الكثير من الحبات الكبيرة الغنية بالماء"، كما يقول دريك ويتكرافت من مصنع ويتكرافت للنبيذ في كاليفورنيا.

الضرر يفوق الفائدة

يجب أن تحظى الأبحاث التطبيقية باهتمام أكبر من قِبل التيار السائد في التعلم الآلي؛ لسبب آخر، يتمثل في أن مجموعات البيانات المعيارية في هذا المجال منفصلة إلى حدٍّ يُرثى له عن الواقع.

حيث يتم قياس أداء نماذج التعلم الآلي الجديدة من خلال مقارنتها مع المجموعات الضخمة من البيانات المنسَّقة التي تفتقر إلى الضجيج، وتتضمن فئات محدَّدة بدقة ومصنَّفة بوضوح (قطة، كلب، طائر)، وينجح التعلم العميق في التعامل مع هذه المشاكل لأنه يفترض وجود عالم مستقر إلى حد كبير (ملف بي دي إف).

لكن في العالم الحقيقي، تتغير هذه الفئات باستمرار بمرور الوقت أو وفقاً للسياق الجغرافي والثقافي. ولسوء الحظ، لم تتم الاستجابة لهذه المشكلة من خلال تطوير أساليب جديدة تتصدى للصعوبات الموجودة في بيانات العالم الحقيقي؛ بدلاً من ذلك، تم دفع الباحثين في مجال التطبيقات إلى إنشاء مجموعات بيانات معيارية خاصة بهم.

وتكمن الغاية وراء هذه المساعي في حصر مشاكل العالم الحقيقي وتحجيمها لتناسب النموذج الذي يستخدمه باحثو التعلم الآلي الآخرون لقياس الأداء. لكن من المرجح ألا تكون مجموعات البيانات الخاصة بمجال معين أفضل من الإصدارات الحالية في تمثيل سيناريوهات العالم الحقيقي، حيث يمكن أن تنطوي النتائج على أضرار تفوق فوائدها؛ إذ إن الأشخاص الذين ربما استفادوا من عمل هؤلاء الباحثين سيصابون بخيبة أمل من التقنيات التي تسجِّل أداءً ضعيفاً عندما تكون الحاجة إليها ماسة.

نظراً للأولويات الخاطئة في هذا المجال، فإن الأشخاص الذين يحاولون حل أكبر تحديات العالم لا يحققون أقصى استفادة ممكنة من الإمكانات الحقيقية للذكاء الاصطناعي. وفي الوقت الذي يحاول فيه الباحثون التفوق على بعضهم البعض في المعايير المصطنعة، فإن واحداً من كل تسعة أشخاص حول العالم يتضوّر جوعاً. كما تزداد درجة حرارة الأرض ويرتفع مستوى سطح البحر بمعدل ينذر بالخطر.

وكما كتب عالم الأعصاب وأبرز مفكّري الذكاء الاصطناعي جاري ماركوس (ملف بي دي إف): "إن أكبر مساهمات الذكاء الاصطناعي في المجتمع... يمكن ويجب أن تأتي في نهاية المطاف في مجالات مثل الاكتشاف العلمي المؤتمت، ما يقود -من بين أمور أخرى- في اتجاه إنجاز إصدارات أكثر تقدماً في الطب مما هو ممكن حالياً. ولكن لتحقيق هذه الغاية، ينبغي علينا أن نضمن عدم احتجاز هذا الحقل ككل في نهاية دنيا محلية".

وحتى يتمكن العالم من الاستفادة من التعلم الآلي، يجب على مجتمع التعلم الآلي أن يسأل نفسه مرة أخرى، كما عبرت عنه واجستاف ذات مرة: "ما الوظيفة الموضوعية لهذا المجال؟" إذا كانت الإجابة هي أن يحمل تأثيراً إيجابياً على العالَم، فحينئذٍ يجب علينا تغيير طريقة تفكيرنا بشأن تطبيقاته.