الشبكات العصبونية المدرّبة تماثل الأداء البشري في الاختبارات النفسية التقليدية

في أوائل القرن العشرين، بدأت مجموعة من علماء النفس التجريبيين الألمان بدراسة طريقة فهم الدماغ لمعاني عالم عشوائي وغير متوقع. وللإجابة عن هذا السؤال، طوروا فكرة "أثر جستالت"، أي أن فهم الشيء يجعله مختلفاً عن أجزائه.

منذ ذلك الحين، اكشف علماء النفس أن الدماغ البشري بارع للغاية في فهم الصور الكاملة بناء على معلومات مجزأة. ومن الأمثلة على هذا الأمر الصور المبينة هنا، حيث أن الدماغ يفهم الأشكال ثنائية الأبعاد مثل المثلث والمربع، وحتى الكرة ثلاثية الأبعاد، على الرغم من أنها ليست مرسومة بشكل واضح ومباشر، بل يقوم الدماغ بتعويض النواقص بنفسه.

من الطبيعي بعد هذا العمل أن نتساءل عن حدوث أثر جستالت في الشبكات العصبونية، حيث أنها مستوحاة من الدماغ البشري، وبالفعل، فإن الباحثين الذين يدرسون الرؤية الآلية يقولون إن الشبكات العصبونية العميقة التي طوروها أثبتت أنها مماثلة للغاية للنظام البصري في أدمغة الرئيسيات، وبعض أجزاء القشرة المخية لدى البشر. وهو ما يؤدي بنا إلى سؤال مثير للاهتمام: كيف يمكن للشبكات العصبونية أن تفهم الجسم بأكمله بمجرد النظر إلى بعض من أجزائه، تماماً كما يفعل البشر؟

سنحصل على الإجابة بفضل عمل بين كيم وزملائها في جوجل براين، وهو قسم أبحاث الذكاء الاصطناعي التابع لجوجل في ماونتن فيو في كاليفورنيا. أجرى الباحثون اختبارات على شبكات عصبونية متنوعة باستخدام نفس تجارب جستالت المخصصة للبشر، ويقولون إنهم وجدوا دليلاً جيداً على أن الآلات تفهم الأجسام الكاملة بالفعل عن طريق ملاحظة أجزائها.

بنى الباحثون تجاربهم على أساس الخدعة البصرية للمثلث، والمبينة في الصورة، حيث قاموا أولاً ببناء ثلاث قواعد بيانات من الصور لتدريب الشبكات العصبونية، وتتألف الأولى من مثلثات عادية كاملة وواضحة بدون أي نقص. أما قاعدة البيانات الثانية فتظهر زوايا المثلثات فقط، بحيث يجب استقراء الخطوط منها لفهم الشكل الكامل، وهي قاعدة البيانات المخصصة للخداع البصري. فعندما يرى البشر صوراً مماثلة، يقومون عادة بإغلاق الفجوات بحيث يفهمون المثلث بالكامل. يقول الباحثون: "نهدف إلى تحديد ما إذا كان أثر الإغلاق والاستكمال هذا موجوداً في الشبكات العصبونية".

أما قاعدة البيانات الثالثة فتتألف من "زوايا" مماثلة ولكنها عشوائية التوجيه، بحيث لا يمكن استقراء الخطوط لتشكيل مثلثات، وهي المجموعة التي لا تحوي الخداع البصري. وعن طريق تغيير أحجام وتوجيهات هذه الأشكال، تمكن الفيق من بناء ألف صورة مختلفة تقريباً لتدريب آلاتهم.

قام الفريق بتدريب الشبكات العصبونية على التعرف على المثلثات العادية الكاملة، ومن ثم اختبار ما إذا كانت ستقوم بتصنيف الصور في مجموعة بيانات الخداع البصري على أنها مثلثات كاملة (مع تجاهل البيانات في المجموعة المغايرة للخداع البصري)، أي أن الاختبار كان يهدف إلى معرفة ما إذا كانت الآلات قادرة على ملء الفراغات في الصور لتشكيل صور كاملة. كما قام الفريق أيضاً بمقارنة سلوك الشبكة العصبونية المدربة مع سلوك شبكة عصبونية غير مدربة، أو مدربة ببيانات عشوائية. توصل الفريق إلى نتائج مثيرة للاهتمام. فقد تبين أن سلوك الشبكات العصبونية المدربة يماثل أثر جستالت لدى البشر بشكل واضح. يقول الباحثون: "تشير نتائجنا إلى أن الشبكات العصبونية المدربة بصور طبيعية تقوم بعملية الإغلاق، على عكس الشبكات المدربة بتثقيل عشوائي أو المدربة بمعلومات بصرية عشوائية".

إنها نتيجة مذهلة، ولا يعود هذا فقط إلى أنها تبين مدى قدرة الشبكات العصبونية على محاكاة الدماغ لفهم العالم، بل هناك مسألة أكثر شمولية أيضاً، حيث أن عمل الفريق يفتح المجال أمام طريقة جديدة كلياً لدراسة الشبكات العصبونية باستخدام أدوات علم النفس التجريبي. يقول الباحثون: "نعتقد أن دراسة قوانين جستالت الأخرى –وبشكل عام، ظواهر نفسية أخرى- ضمن سياق الشبكات العصبونية مجال واعد للأبحاث المستقبلية". يبدو أن هذا البحث يمثل الخطوة الأولى نحو مجال جديد في علم النفس الآلي. وكما يقول فريق جوجل: "إن فهم الاختلافات بين البشر والشبكات العصبونية سيكون مفيداً بالنسبة للأبحاث المتعلقة بإمكانية فهم عمل خوارزميات الذكاء الاصطناعي، وذلك عن طريق توضيح الفروق ما بين نوعين مفكرين مثيرين للإعجاب".

لا شك في أن علماء النفس التجريبيين الألمان من أوائل القرن العشرين كانوا سيشعرون بالدهشة إزاء هذا العمل.

مرجع: arxiv.org/abs/1903.01069: هل توجد ظواهر جستالت في الشبكات العصبونية؟ دراسة تجريبية لقانون الإغلاق.