إذا رأى طفلٌ بعمر 6 أشهر لعبةً على شكل شاحنة تحوم ظاهرياً في الهواء بعد أن تخرج عن حافة المضمار، فلن يُثير هذا المنظر أي استغراب لديه. ولكن إذا عُرضت نفس التجربة عليه بعد شهرين أو ثلاثة فقط، فسوف يميز على الفور وجود شيء غير مألوف، ويعود هذا إلى أنه تعلَّم فكرة الجاذبية. تحدث يان ليكون، وهو كبير علماء الذكاء الاصطناعي في فيسبوك وبروفيسور في جامعة نيويورك، في ندوة منقولة عبر الإنترنت نظمتها مؤخراً جمعية الآلات الحاسوبية، وهي إحدى مؤسسات هذا المجال، حيث قال: "لا أحد يخبر الطفل أنه يُفترض بالأجسام أن تنجذب نحو الأسفل"، وبما أن الأطفال لا يتمتعون بمهارات حركية معقدة، فهو يعتقد أن "الكثير مما يتعلمونه عن العالم ناتج عن الملاحظة"، وهي نظرية يمكن أن تحمل نتائج هامة للعلماء الذين يحاولون تطوير الذكاء الاصطناعي.
حقق التعلم الآلي -وهو فرع من الذكاء الاصطناعي يعود إليه الفضل في إطلاق أحدث ثورات هذا المجال- إنجازاتٍ هامةً في منح الآلات قدرات حسية مثل الرؤية، غير أنه لم يتمكن من منحها قدرات منطقية معقدة تعتمد على نموذج مجرد للواقع. وباختصار، فإن الآلات لا تتمتع بأي فهم فعلي للعالم من حولها، مما يجعلها قاصرة في التعامل معه. وقد ظهرت أساليب جديدة للتغلب على هذه المشكلة، مثل منح الآلات ذاكرة ديناميكية من أجل مراكمة الحقائق والمبادئ الأساسية التي تتعلمها، بحيث تعتمد عليها في تفاعلاتها اللاحقة مع العالم.
غير أن ليكون يعتقد أن هذا ليس سوى جزء واحد من الأحجية فقط، كما يقول: "من الواضح أنه فاتنا شيء ما"، حيث إنه يمكن للطفل أن يكوّن فكرة عن الفيل بعد رؤية صورتين فقط، في حين تحتاج خوارزميات التعلم العميق إلى الآلاف من الصور، وربما حتى الملايين. ويمكن لمراهق أن يتعلم القيادة بشكل آمن بعد التدرب حوالي 20 ساعة، ويستطيع تجنب الحوادث دون التعرض إليها من قبل، في حين تحتاج خوارزميات التعلم المعزز (وهي فئة من التعلم العميق) إلى عشرات الملايين من التجارب، بما فيها الكثير من الأخطاء الكارثية.
ويرى ليكون أن الجواب يكمن في فئةٍ من التعلم العميق -لا تحظى بما تستحقه من الاهتمام- تسمى بالتعلم غير الموجه. ففي حين أن الخوارزميات المبنية على التعلم الموجه والتعلم المعزز تتعلم تحقيقَ هدف ما اعتماداً على الدخل البشري، فإن خوارزميات التعلم غير الموجه تستخلص الأنماط بشكل مستقل تماماً، ويفضل ليكون استخدام تعبير "التعلم ذاتي الإشراف" لأنه يعتمد على جزء من بيانات التدريب لتوقع بقيتها.
في السنوات الأخيرة، حققت هذه الخوارزميات زخماً جيداً في معالجة اللغات الطبيعية بسبب قدرتها على إيجاد العلاقات بين مليارات الكلمات، وهو ما أثبت فائدة كبيرة في بناء أنظمة توقع النصوص مثل الاستكمال الآلي للجمل، أو لتوليد كتابات جيدة التزييف. ولكن الأغلبية العظمى من أبحاث الذكاء الاصطناعي في المجالات الأخرى كانت تركز على التعلم الموجه أو المعزز.
كما يعتقد ليكون أن هذه الآية يجب أن تنقلب، حيث يقول: "إن كل ما نتعلمه كبشر تقريباً يتم عن طريق التعلم ذاتي الإشراف. هناك جزء صغير نكتسبه عن طريق التعلم الموجه، وجزء صغير آخر عن طريق التعلم المعزز. ولو كان التعلم الآلي أو الذكاء الاصطناعي كعكة، لكانت أغلب طبقاتها من التعلم ذاتي الإشراف".
ولكن كيف سيتجسد هذا عملياً؟ يجب أن يبدأ الباحثون بالتركيز على التوقع الزمني؛ أي تدريب الشبكات العصبونية الكبيرة على توقع النصف الثاني من مقطع فيديو معين بعد مشاهدة النصف الأول منه. وفي حين أنه لا يمكننا توقع كل شيء في هذا العالم، فإن التوقع هو المهارة الأساسية التي يعتمد عليها الطفل في إدراك أن اللعبة الشاحنة يجب أن تقع. يقول ليكون: "إن الأمر أشبه بعمل محاكاة لما يجري داخل رأسك".
وما أن يتم تطوير هذه القدرات بما يكفي، ستجد استخدامات عملية هامة أيضاً. يقول ليكون: "سيكون من الجيد دراسة توقع الفيديو في إطار تطوير السيارات ذاتية القيادة، لأنه من المهم أن نعرف بشكل سابق ما ستفعله السيارات الأخرى الموجودة في الشارع".
وفي المحصلة، فإن التعلم غير الموجه سيساعد الآلاتِ على تطوير نموذج للعالم يمكن الاعتماد عليه لتوقع أحداث وأوضاع مستقبلية ضمنه، كما يقول ليكون. إنه طموح كبير لطالما أثار حيرة باحثي الذكاء الاصطناعي، ولكنه سيفتح المجال أمام مجموعة جديدة من القدرات، ويشعر ليكون بالثقة إزاء هذا التوجه، حيث يقول: "ستكون الثورة التالية في الذكاء الاصطناعي غير موجهة".