منذ سنة ونصف تقريباً، أدرك يان لوكون أنه كان مخطئاً في تصوراته.
يشغل لوكون منصب كبير العلماء في مختبر الذكاء الاصطناعي في شركة "ميتا" (Meta)، كما أنه أحد أكثر باحثي الذكاء الاصطناعي تأثيراً في العالم، وقد كان يحاول منح الآلات فهماً أساسياً لطريقة سير العالم –على نحو يشبه المنطق السليم- بتدريب الشبكات العصبونية على توقع ما سيحدث تالياً في مقاطع فيديو للأحداث اليومية. ولكن التنبؤ بالمستقبل على شكل بيكسلات من لقطات فيديو كان أمراً فائق التعقيد. وهكذا، وصل إلى طريق مسدود.
والآن، وبعد دراسة دامت عدة أشهر في محاولة لتحديد المشكلة، توصل إلى رؤية جديدة وجريئة للجيل الجديد من الذكاء الاصطناعي. وفي مسودة أولية لوثيقة شاركها مع إم آي تي تكنولوجي ريفيو، حدد لوكون الملامح الأولية لمقاربة يعتقد أنها ستؤدي يوماً ما إلى منح الآلات المنطق السليم الذي تحتاجه للعمل ضمن العالم. وبالنسبة للوكون، فإن هذه الاقتراحات قد تكون الخطوات الأولى على طريق بناء آلات تتمتع بالقدرة على التفكير والتخطيط مثل البشر، وهو ما يطلق عليه الكثيرون الذكاء الاصطناعي العام، أو اختصاراً "أيه جي آي" (AGI). كما أنه يبتعد عن أكثر التوجهات انتشاراً في مجال التعلم الآلي حالياً، ويستعيد بعضاً من الأفكار القديمة التي كانت تُعتبر منتهية الصلاحية.
اقرأ أيضاً: التعلم الآلي يتنبأ بما إذا كنت ستنفصل عن شريك حياتك
ولكن رؤيته ليست شاملة على الإطلاق، بل من المحتمل أنها تثير من التساؤلات أكثر مما تجيب عنها. ومن أهم التساؤلات، كما يشير لوكون بنفسه، هو أنه لا يدري كيف يبني ما يصفه.
فالعنصر المركزي في هذه المقاربة الجديدة شبكة عصبونية يمكن أن تتعلم رؤية العالم على مستويات مختلفة من الدقة. وبالتخلي عن الحاجة إلى التوقعات بدقة البيكسل، فإن هذه الشبكة ستركز فقط على عناصر المشهد المتعلقة بالمهمة المطلوبة. وقد وصل لوكون هذه الشبكة بشبكة أخرى، تحمل اسم شبكة الضبط، وهي التي تحدد مستوى التفاصيل المطلوبة، وتعدل النظام بأسره وفقاً لهذا.
وبالنسبة للوكون، فإن الذكاء الاصطناعي العام سيكون جزءاً من طريقة تفاعلنا مع التكنولوجيا في المستقبل. وتحمل رؤيته بعض ملامح رؤية الشركة التي يعمل فيها، ميتا، والتي تدفع باتجاه ميتافيرس الواقع الافتراضي. ويقول إن الناس سيتوقفون عن حمل الهواتف الذكية في جيوبهم بعد 10-15 سنة، وسيستخدمون بدلاً منها نظارات الواقع المعزز المزودة بمساعدات افتراضية تساعد البشر خلال حياتهم اليومية. ويقول: "حتى تكون هذه الأدوات مفيدة لنا، يجب أن تتمتع بذكاء يقارب مستوى الذكاء البشري بصورة أساسية".
يقول باحث الذكاء الاصطناعي في جامعة مونتريال والمدير العلمي لمعهد ميلا كيبيك، يوشوا بينجيو: "كان يان يتحدث عن الكثير من هذه الأفكار منذ فترة. ولكن من الرائع أن نراها معاً في إطار صورة واحدة شاملة". يعتقد بينجيو أن يان يطرح الأسئلة الصحيحة. كما يعتقد أنه من الرائع أن يكون لوكون مستعداً لنشر وثيقة لا تتضمن الكثير من الإجابات. ويقول إن هذه الوثيقة أقرب إلى مقترح بحثي منها إلى مجموعة من النتائج الواضحة.
ويضيف: "يتحدث الناس عن هذه المواضيع خلف الأبواب المغلقة، ولكن ليس من المعتاد أن تتم مشاركتها علناً. فهذا ينطوي على مخاطرة كبيرة".
اقرأ أيضاً: لماذا لا تحظى الأبحاث التطبيقية للتعلم الآلي بالاهتمام الذي تستحقه؟
مسألة منطق سليم
كان لوكون يفكر في الذكاء الاصطناعي لفترة 40 سنة تقريباً. وفي 2018، كان أحد الفائزين بأهم جائزة في الحوسبة، وهي جائزة تورينغ، مع بينجيو وجيفري هينتون، وذلك لعمله الرائد في مجال التعلم العميق. ويقول: "إن هدف حياتي هو جعل الآلات قادرة على التصرف مثل البشر والحيوانات".
يعتقد لوكون أن أدمغة الحيوانات تتضمن نوعاً من المحاكاة للعالم، وهو ما يطلق عليه اسم نموذج العالم. ويتم تعلم هذا النموذج منذ الطفولة، وهو الطريقة التي تستخدمها الحيوانات (والبشر أيضاً) لصياغة تخمينات صحيحة حول ما سيحدث حولها. ويقول لوكون إن الأطفال يتعلمون المبادئ في الأشهر الأولى من حياتهم عن طريق مراقبة العالم. فرؤية كرة تقع بعد إفلاتها لعدة مرات سيعطي الطفل فكرة عن تأثير الجاذبية.
ويعبر مصطلح "المنطق السليم" عن كل أشكال هذا التفكير البديهي. فهو يتضمن إدراكاً للمبادئ الفيزيائية البسيطة، مثل معرفة أن العالم ثلاثي الأبعاد وأن الأجسام في الواقع لا تختفي عند خروجها من المشهد. ويتيح لنا توقع مكان وجود كرة نطاطة أو دراجة منطلقة بسرعة بعد عدة ثوانٍ من الوقت. كما يساعدنا أيضاً على التوصل إلى الاستنتاجات من المعلومات الناقصة، فإذا سمعنا صوت ضجيج معدني فجائي من المطبخ، يمكن أن نخمن أن شخصاً ما أوقع صينية، لأننا نعرف ما هي أنواع الأجسام التي تصدر هذا الضجيج، ومتى تصدره.
اقرأ أيضاً: الذكاء الاصطناعي الإبداعي والحوسبة التطورية: الجيل القادم من التعلم العميق
وباختصار، فإن المنطق السليم يتيح لنا التمييز بين الأحداث المستحيلة والممكنة، والأحداث الأكثر ترجيحاً من غيرها. ويتيح لنا تخيل عواقب أفعالنا ووضع الخطط، وتجاهل التفاصيل غير المهمة.
ولكن تعليم المنطق السليم للآلة أمر صعب للغاية. فالشبكات العصبونية الحالية تحتاج إلى رؤية الآلاف من الأمثلة قبل أن تبدأ بكشف أنماط مماثلة.
ويمكن أن نلخص المنطق السليم بأنه القدرة على توقع ما سيحدث تالياً. يقول لوكون: "هذا جوهر الذكاء". ولهذا، كانوا –هو وبضعة باحثين آخرين- يستخدمون مقاطع الفيديو لتدريب نماذجهم. ولكن تقنيات التعلم الآلي الحالية تستوجب على النماذج توقع ما سيحدث بالضبط في اللقطة التالية، وتوليد محتواها بيكسلاً تلو الآخر. وكما يقول لوكون، تخيل أنك حملت قلماً وتركته يفلت من يدك. يقول المنطق السليم إن القلم سيقع، ولكنه لا يقول لك أين سينتهي المطاف به بالضبط. إن توقع هذا الأمر يتطلب إجراء بعض الحسابات الفيزيائية الصعبة.
ولهذا، يحاول لوكون الآن تدريب شبكة عصبونية تستطيع أن تركز فقط على المفاهيم المهمة في العالم الفيزيائي، أي توقع أن القلم سيقع، ولكن دون تحديد مكان سقوطه بالضبط. وينظر إلى هذه الشبكة المدربة على أنها مكافئة لنموذج العالم الذي تعتمد عليه الحيوانات.
اقرأ أيضاً: الشبكات العصبونية الاصطناعية تُعلّم نفسها شم الرائحة كخلايا الدماغ تماماً
مكونات غامضة
يقول لوكون إنه قام ببناء نسخة أولية من هذا النموذج المحاكي للعالم مع قدرة للتعرف على الأجسام الأساسية. ويعمل الآن على تدريبه على التنبؤ. ولكن طريقة عمل شبكة الضبط ما تزال غامضة، كما يقول. وينظر لوكون إلى هذه الشبكة العصبونية على أنها تتحكم بكامل النظام. فسوف تقرر ماهية التنبؤات التي يجب أن يقدمها نموذج العالم في لحظة زمنية معينة، ومستوى التفاصيل التي يجب أن يركز عليها للحصول على هذه التنبؤات، وتقوم بتعديل النموذج وفق المطلوب.
وعلى الرغم من قناعة لوكون بضرورة وجود هذه الشبكة للضبط، فإنه لا يعرف كيف سيقوم بتدريبها على هذا العمل. ويقول: "نحتاج إلى وصفة جيدة لإنجاح هذا الأمر، ولكننا لا نمتلك هذه الوصفة بعد".
وفي رؤية لوكون، يمثل نموذج العالم وشبكة الضبط عنصرين أساسيين في نظام أكبر، ويُعرف هذا النظام باسم البنية الإدراكية، والتي تتضمن شبكات عصبونية أخرى، مثل نموذج الإدراك الذي يقوم باستشعار العالم، ونموذج آخر يستخدم مفهوم المكافآت لتحفيز الذكاء الاصطناعي على الاستكشاف أو لضبط سلوكه.
ويقول لوكون إن كل شبكة عصبونية تمثل تقريباً جزءاً من الدماغ. وعلى سبيل المثال، فإن شبكة الضبط ونموذج العالم يحاكيان بعض وظائف قشرة الفص الجبهي. أما النموذج التحفيزي فيقابل بعض وظائف اللوزة الدماغية، وهكذا دواليك.
اقرأ أيضاً: علماء الكمبيوتر يرغبون في محاكاة أداء الدماغ البشري باستخدام الشبكات العصبونية
إن فكرة البنى الإدراكية، خصوصاً البنى المستوحاة من الدماغ، كانت موجودة منذ عقود من الزمن. وكذلك الكثير من أفكار لوكون حول التوقع باستخدام نماذج مع مستويات مختلفة من التفاصيل. ولكن عندما أصبح التعلم العميق المقاربة المهيمنة على مجال الذكاء الاصطناعي، فقدت الكثير من هذه الأفكار القديمة شعبيتها. ويقول: "لقد نسي باحثو الذكاء الاصطناعي هذه الأفكار إلى حد ما".
ولكنه أخذ هذه الأفكار القديمة وعمل على إعادة تأهيلها، مقترحاً أساليب جديدة لدمجها مع تقنيات التعلم العميق. وبالنسبة للوكون، فإن إعادة استخدام هذه الأفكار القديمة أمر أساسي، لأنه يعتقد أن المقاربتين الأساسيتين المهيمنتين على مجال الذكاء الاصطناعي العصري لن تفضيا إلى أي نتائج ملموسة.
ففيما يتعلق ببناء الذكاء الاصطناعي العام، هناك توجهان أساسيان. حيث يعتقد الكثير من الباحثين، الذين يعتمدون التوجه الأول، أن النجاح المذهل الذي حققته النماذج فائقة الضخامة لتوليد الصور أو اللغة، مثل "جي بي تي 3" (GPT3) و"دال-إي" (DALL-E) من "أوبن أيه آي" (Open AI)، يثبت أن كل ما نحتاج إليه هو بناء نماذج أكثر ضخامة وحسب.
أما التوجه الآخر فيقوم على التركيز على التعلم المعزز، وهو تقنية الذكاء الاصطناعي التي تعتمد أسلوب مكافأة سلوكيات محددة لدفع الشبكات العصبونية إلى التعلم بطريقة التجربة والخطأ. وهي نفس الطريقة التي اعتمدت عليها "ديب مايند" (DeepMind) لتدريب أنظمة الذكاء الاصطناعي المختصة بالألعاب لديها، مثل "ألفازيرو" (AlphaZero). وتقول الحجة إن الحصول على المكافآت بشكل صحيح سيدفع بعملية التعلم المعزز في نهاية المطاف إلى إنتاج ذكاء اصطناعي أكثر عمومية.
اقرأ أيضاً: ما هي أهم ميزة أغفلها الضجيج الإعلامي بشأن نموذج الذكاء الاصطناعي الجديد من ديب مايند؟
ولكن لوكون ينفي صحة كل هذا. ويقول: "إن الفكرة التي تقول بأنه ما علينا سوى تضخيم النماذج اللغوية الكبيرة حتى يظهر ذكاء اصطناعي بمستوى ذكاء البشر في نهاية المطاف خاطئة، ولا أصدقها لثانية واحدة". ويضيف إن هذه النماذج لا تقوم سوى بالتلاعب بالكلمات والصور. وليس لديها أي خبرة أو تجربة مباشرة مع العالم.
وهو متشكك بالقدر نفسه إزاء التعلم المعزز، لأنه يتطلب كميات هائلة من البيانات لتدريب النماذج على القيام حتى بأبسط المهام. ويقول: "أعتقد أنه لا توجد أي فرصة للنجاح باستخدام هذه الطريقة".
أما ديفيد سيلفر من ديب مايند، والذي قاد العمل على ألفازيرو، وهو من أكبر مناصري التعلم المعزز، فيختلف مع هذا التقييم، ولكنه يرحب برؤية لوكون الإجمالية. ويقول: "إنه اقتراح جديد ومثير للاهتمام لطريقة تمثيل نموذج العالم وكيفية تعلمه".
أما الباحثة في مجال الذكاء الاصطناعي في معهد سانتا فيه، ميلاني ميتشل، فهي أيضاً تشعر بالحماس إزاء رؤية توجه جديد بالكامل. وتقول: "لم نر فعلياً عملاً كهذا من أوساط التعلم العميق". وهي تتفق أيضاً مع لوكون على أن النماذج اللغوية الكبيرة ليست كل شيء. وتقول: "إنها تفتقر إلى الذاكرة والنماذج الداخلية للعالم، والتي تحمل أهمية كبيرة في الواقع".
أما الباحثة في مختبر جوجل براين، ناتاشا جاك، فتعتقد أن النماذج اللغوية يمكن على أي حال أن تؤدي دوراً مهماً. وتقول إنه من المستغرب أن تكون اللغة غائبة تماماً من مقترحات لوكون: "نحن نعلم أن النماذج اللغوية الكبيرة فعالة للغاية، وتتضمن شيئاً من المعرفة البشرية".
اقرأ أيضاً: لماذا لا يمكن للنموذج اللغوي لامدا أن يمتلك وعي البشر كما قال مهندس في جوجل؟
وتشير جاك، والتي تعمل على أساليب لدفع أنظمة الذكاء الاصطناعي إلى مشاركة معلوماتها وقدراتها مع بعضها بعضاً، إلى أن البشر لا يحتاجون إلى تجربة مباشرة مع شيء ما لاكتساب معلومات عنه. فنحن نستطيع تغيير سلوكنا ببساطة بمجرد أن يُقال لنا شيء ما، مثل تفادي لمس قدر ساخنة. وتتساءل: "كيف يمكن تحديث نموذج العالم الذي اقترحه يان دون لغة؟".
هناك مسألة أخرى أيضاً. فإذا نجحت أفكار لوكون، يمكن أن تؤدي إلى ظهور تكنولوجيا ذات قدرات عالية ويمكن أن تحدث تحولاً هائلاً يضاهي ما أحدثته الإنترنت.
غير أن هذا المقترح لا يناقش كيفية التحكم في سلوك ودوافع هذا النموذج، أو الجهة التي ستتولى هذا التحكم. يقول مؤسس معهد مونتريال لأخلاقيات الذكاء الاصطناعي وخبير الذكاء الاصطناعي المسؤول في مجموعة بوسطن الاستشارية، أبيشيك غوبتا، إن هذا الإغفال يدعو للاستغراب.
ويضيف: "يجب أن نفكر أكثر في ما يحتاجه الذكاء الاصطناعي حتى يعمل بصورة جيدة ضمن المجتمع، وهو ما يتطلب التفكير في السلوكيات الأخلاقية، إضافة إلى أمور أخرى".
ولكن جاك تلحظ أن مقترحات لوكون ما زالت أقرب إلى أفكار منها إلى تطبيقات عملية. وتشاركها ميتشل الرأي: "ليس هناك أي احتمال لتحول هذه الأفكار إلى ذكاء اصطناعي من مستوى الذكاء البشري عمّا قريب".
ومن المؤكد أن لوكون يتفق مع هذه النظرة. فهو يهدف إلى زرع بذور مقاربة جديدة على أمل أن يقوم آخرون بتطويرها. ويقول: "سيتطلب هذا العمل جهوداً حثيثة وعدداً كبيراً من المشاركين. وقد اقترحت هذه الأفكار لأنني أعتقد أننا يجب أن نسلك هذه الطريق في نهاية المطاف". وإذا لم يتحقق هذا، فإن لوكون يرغب على أقل تقدير في إقناع الناس بأن النماذج اللغوية الكبيرة والتعلم المعزز هي أساليب غير مجدية لتحقيق تطور حقيقي.
ويقول: "أكره أن أرى الباحثين يضيعون وقتهم عبثاً".