هل سيتمكن التعلم العميق من القيام بكل شيء كما يقول جيف هينتون؟

4 دقائق
هل سيتمكن التعلم العميق من القيام بكل شيء كما يقول جيف هينتون؟
مصدر الصورة: نوح بيرجر عبر أسوشييتد برس
  • حول الثغرات في مجال الذكاء الاصطناعي: “لا بدّ من تحقيق عدد لا بأس به من الاختراقات المفاهيمية… كما نحتاج إلى زيادة هائلة في نطاقها”.
  • حول نقاط ضعف الشبكات العصبونية: “تتمتع الشبكات العصبونية بقدرة مدهشة على التعامل مع كمية صغيرة إلى حد ما من البيانات ومع عدد هائل من المعاملات الوسيطة، ولكن البشر يتفوقون عليها حتى في ذلك”.
  • حول كيفية عمل أدمغتنا: “ما يوجد داخل الدماغ هو هذه النواقل الكبيرة للنشاط العصبي”.

انطلقت ثورة الذكاء الاصطناعي الحديثة خلال مسابقة بحثية مغمورة. كان ذلك في عام 2012، العام الثالث من مسابقة إيماج نِت (ImageNet) السنوية، التي وضعت تحدياً أمام الفرق المشاركة يتمثل في بناء أنظمة رؤية حاسوبية يمكنها التعرف على 1,000 شيء في صور تضم حيوانات ومناظر طبيعية وبشراً.

في أول عامين من المسابقة، فشلت أفضل الفرق في الوصول حتى إلى مستوى دقة 75%. ولكن في العام الثالث، تمكنت مجموعة من ثلاثة باحثين (أستاذ وطلابه) فجأة من تحطيم هذا المستوى وتجاوزه بفارق كبير. لقد فازوا في المنافسة بنسبة مذهلة بلغت 10,8 نقطة مئوية. كان ذلك الأستاذ هو جيفري هينتون، وسُمِّيت التقنية التي استخدموها التعلم العميق.

في الواقع، كان هينتون يعمل في مجال التعلم العميق منذ ثمانينيات القرن الماضي، لكن فعالية هذا المجال كانت محدودة بسبب نقص البيانات وضعف القدرة الحاسوبية. غير أن إيمانه الراسخ بهذه التقنية قد أثمر في نهاية المطاف وأدى إلى تحقيق مكاسب هائلة؛ ففي السنة الرابعة من مسابقة إيماج نِت، كانت جميع الفرق المشاركة تقريباً تستخدم التعلم العميق وتحقق نتائج خارقة من حيث الدقة. وسرعان ما تم تطبيق التعلم العميق على مهام تتجاوز التعرف على الصور، وفي نطاق واسع من الصناعات أيضاً.

في العام الماضي، وتكريماً له لمساهماته التأسيسية في هذا المجال، حصل هينتون على جائزة تورينج، جنباً إلى جنب مع رائدَي الذكاء الاصطناعي الآخرَين يان ليكون ويوشوا بنجيو. في 20 أكتوبر، تحدثت معه ضمن فعاليات مؤتمر إيمتيك إم آي تي السنوي، الذي تنظمه إم آي تي تكنولوجي ريفيو، حول الوضع الراهن لمجال التعلم العميق والأهداف التالية التي يعتقد أنه سيحققها في المستقبل.

تم تكثيف وتعديل هذه المقابلة لغرض الوضوح.

أنت ترى أن التعلم العميق يتمتع بالقدرة الكافية لمحاكاة كامل الذكاء البشري، ما الذي يجعلك على يقين من ذلك؟

أعتقد حقاً أن التعلم العميق سيكون قادراً على القيام بكل شيء، لكنني أعتقد أنه لابدّ من تحقيق عدد لا بأس به من الاختراقات المفاهيمية. على سبيل المثال، في عام 2017، قام أشيش فازواني وزملاؤه بإدخال مفهوم المحوِّلات، التي تستنبط نواقل جيدة حقاً لتمثيل معاني الكلمات. لقد كان ذلك اختراقاً مفاهيمياً، ويتم استخدامه الآن في أفضل نماذج معالجة اللغة الطبيعية وجميعها تقريباً. وأرى أننا سنحتاج إلى المزيد من الاختراقات من هذا القبيل.

وإذا ما تمكنا من تحقيق هذه الاختراقات، فهل سنكون قادرين على مقاربة الذكاء البشري بأكمله بالاعتماد على التعلم العميق؟

نعم، وعلى وجه الخصوص، أعني تحقيق اختراقات ذات صلة بكيفية الحصول على نواقل كبيرة للنشاط العصبي بما يسمح بنمذجة أمور مثل المنطق. لكننا نحتاج أيضاً إلى زيادة هائلة في النطاق؛ حيث يحتوي دماغ الإنسان حوالي 100 تريليون عامل وسيط أو مشابك عصبية. وما نعتبره اليوم نموذجاً كبيراً بالفعل، مثل جي بي تي-3 (GPT-3)، يحتوي 175 مليار معامل وسيط. أي إنه أصغر بألف مرة من الدماغ البشري. يستطيع نموذج جي بي تي-3 الآن إنشاء نص منطقي إلى درجة بعيدة، ولا يزال ضئيلاً مقارنة بالدماغ.

عندما تقول “نطاق أوسع”، أتعني شبكات عصبونية أكبر أم بيانات أكثر أم كليهما؟

أعني الأمرين معاً. هناك نوع من التناقض بين ما يحدث في علوم الحاسوب وما يحدث مع الناس؛ إذ يمتلك البشر قدراً هائلاً من المعاملات الوسيطة مقارنة بكمية البيانات التي يحصلون عليها. فعلى الرغم من أن الشبكات العصبونية تتمتع بقدرة مدهشة على التعامل مع كمية صغيرة إلى حد ما من البيانات مع عدد ضخم من المعاملات الوسيطة، لكن البشر يتمتعون بقدرات أكبر منها.

يعتقد الكثير من العاملين في هذا المجال أن القدرة الكبيرة التالية التي ينبغي العمل على تحقيقها تتمثل في المنطق السليم، هل توافقهم الرأي؟

أتفق معهم في أنها أحد الأمور المهمة للغاية. وأرى أيضاً أن التحكم في المحركات مهم جداً هو الآخر، والشبكات العصبونية العميقة أصبحت جيدة الآن في ذلك. على وجه الخصوص، أظهرت بعض الأبحاث الحديثة في جوجل أنه يمكنك التحكم في المحرك بشكل جيد ودمج ذلك مع اللغة، بحيث يمكنك فتح درج وإخراج كتلة، ويمكن للنظام إخبارك بلغة طبيعية بما يفعله.

بالنسبة لأشياء مثل جي بي تي-3، التي تنشئ هذا النص الرائع، من الواضح أنه ينبغي عليها أن تفهم الكثير لإنشاء ذلك النص، ولكن ليس من الواضح تماماً مدى فهمها. غير أنه إذا تمكن نظام ما من فتح الدرج وإخراج كتلة، وقال: “لقد فتحت للتو الدرج وأخرجت كتلة”، فمن الصعب القول إنه لا يفهم ما يفعله.

لطالما نظر مجال الذكاء الاصطناعي إلى الدماغ البشري باعتباره أكبر مصدر للإلهام، وقد نشأت أساليب مختلفة في الذكاء الاصطناعي مستندة إلى نظريات مختلفة في العلوم المعرفية. هل تعتقد أن الدماغ يبني في الواقع تصورات للعالم الخارجي حتى يتمكن من فهمه، أم أن هذه مجرد طريقة مفيدة للتفكير حول العالم من حوله؟

منذ زمن بعيد، كان هناك نقاش في العلوم المعرفية بين مدرستين فكريتين. قاد ستيفن كوسلين إحداها، وكان يعتقد أنه عندما تتلاعب بالصور المرئية في عقلك، فإن ما لديك هو مجموعة من وحدات البكسل وأنت تحرّكها. أما المدرسة الفكرية الأخرى فقد كانت أكثر انسجاماً مع الذكاء الاصطناعي التقليدي؛ حيث قالت: “لا، قطعاً، هذا هراء، إنها توصيفات هيكلية هرمية. لديك بنية رمزية في عقلك، وهذا ما تتلاعب به”.

أعتقد أن كلتا المدرستين ارتكبتا الخطأ نفسه؛ حيث اعتقد كوسلين أننا نتلاعب بوحدات البكسل لأن الصور الخارجية تتشكل من وحدات البكسل، وهذا تمثيل نفهمه. بينما اعتقدت مجموعة البنية الرمزية أننا نتلاعب بالرموز لأننا نمثل الأشياء أيضاً في هيئة رموز، وهذا تمثيل نفهمه. وأعتقد أن كليهما مخطئ بنفس القدر؛ إذ إن ما يوجد داخل الدماغ هو هذه النواقل الكبيرة للنشاط العصبي.

هناك بعض الأشخاص الذين ما زالوا يعتقدون أن التمثيل الرمزي هو أحد أساليب الذكاء الاصطناعي.

هذا صحيح؛ لدي أصدقاء مقربون مثل هيكتور ليفيسك، الذي يؤمن حقاً بالأسلوب الرمزي وقد قام بعمل رائع في هذا الصدد. ورغم اختلافي معه، لكن يبقى الأسلوب الرمزي أمراً من المنطقي تجربته. لكن أعتقد أننا في نهاية المطاف سوف ندرك أن الرموز موجودة فقط في العالم الخارجي، بينما نقوم نحن بعمليات داخلية على نواقل كبيرة.

ما وجهة نظرك الأكثر تناقضاً مع التيار السائد بشأن مستقبل الذكاء الاصطناعي؟

حسناً، تكمن المسألة في أن آرائي كانت مناقضة للتيار السائد، وبعد خمس سنوات أصبحت آرائي هي التيار السائد. إن معظم وجهات نظري المتعارضة مع التيار العام منذ الثمانينيات من القرن الماضي أصبحت اليوم مقبولة على نطاق واسع. ومن الصعب جداً الآن أن تجد أحداً يعارض تلك الآراء. لذا، نعم، لقد تم التقليل بعض الشيء من أهمية أفكاري لأنها كانت متضاربة مع التوجه السائد.