أحد مفاهيم علم النفس يساعد الذكاء الاصطناعي على التنقل في عالمنا بشكل أفضل

2 دقائق
مصدر الصورة: إم إس تك عبر بيكساباي

المفهوم

عندما ننظر إلى كرسي ما، فنحن نعلم أن بإمكاننا الجلوسَ عليه بصرف النظر عن شكله أو لونه، عندما تكون السمكة في الماء، فنحن نعلم أن بإمكانها السباحة بصرف النظر عن موقعها الجغرافي. يُعرف هذا باسم نظرية القدرة (إمكانية الفعل)، وهو مصطلح صاغَه عالم النفس جيمس ج. جيبسون. تنص هذه النظرية على أنه عندما تنظر الكائنات الذكية إلى العالم، فإن إدراكها لا يقتصر فقط على الأشياء وعلاقاتها المكانية، بل إنها تدرك الإمكانات التي تتيحها لتطبيق الأفعال أيضاً. وبعبارة أخرى، فإن الكرسي "يتيح" إمكانية الجلوس، والماء "يتيح" إمكانية السباحة. يمكن لهذه النظرية أن تفسّر جزئياً الإمكانية الكبيرة لتعميم الذكاء عند الحيوانات، ففي الغالب نحن نعرف على الفور كيفيةَ التعامل مع الأشياء الجديدة لأننا ندرك الإمكانات التي تتيحها.

فحوى الفكرة

يستخدم مجموعة من الباحثين في ديب مايند اليوم هذا المفهوم من أجل تطوير مقاربة جديدة للتعلم المعزز. في التعلم المعزز التقليدي، يتعلم الوكيل من خلال التجربة والخطأ، بدءاً من الافتراض القائل بأن أي إجراء أو فعل هو قابل للتطبيق؛ فالروبوت الذي يتعلم الانتقال من النقطة A إلى النقطة B على سبيل المثال، سوف يفترض أن بإمكانه التحرك عبر الجدران أو قطع الأثاث، إلى أن "تخبره" حالاتُ الفشل المتكررة ما هو خلاف ذلك. تكمن الفكرة في أنه إذا تم تعليم الروبوت في البداية الإمكانات المتاحة لبيئته المحيطة، فسيزيل على الفور جزءاً كبيراً من التجارب الفاشلة التي كان يتعين عليه إجراؤها. هذا من شأنه أن يجعل عملية التعلم عند الروبوت أكثر كفاءة، وسيساعده على التعميم ضمن البيئات المختلفة.

التجارب

وضع الباحثون سيناريو افتراضياً بسيطاً؛ حيث وضعوا وكيلاً افتراضياً في بيئة ثنائية الأبعاد يتوسطها جدار، وجعلوا الوكيل يستكشف المدى المتاح أمامه للحركة، إلى أن يتعلم ما الذي تسمح له البيئة المحيطة  بالقيام به، أي إلى أن يتعلم إمكاناتها. ثم أعطى الباحثون الوكيلَ مجموعةً من الأهداف البسيطة لتحقيقها من خلال التعلم المعزز، مثل تحريك كمية معينة باتجاه اليمين أو باتجاه اليسار. وجد الباحثون أنه مقارنة بوكيل آخر لم يتعلم شيئاً عن إمكانات البيئة المحيطة، فقد تجنب هذا الوكيل القيام بأي حركة قد تؤدي به إلى طريق مسدودة بسبب اعتراض الجدار له أثناء التنقل، ما يجعله يحقق هدفه بكفاءة أكبر.

ما أهمية ذلك؟

لا يزال العمل في مراحله الأولى، لذلك لم يستخدم الباحثون سوى بيئة بسيطة وأهداف بدائية فقط.  لكنهم يأملون في أن تساعد تجاربهم الأوّلية في إرساء أساسٍ نظري لتوسيع نطاق الفكرة لكي يشمل إجراءات وأفعالاً أكثر تعقيداً. أما عن تطلعاتهم المستقبلية، فهم يرون أن هذه المقاربة سوف تسمح للروبوت بأن يقدّر بسرعة ما إذا كان بإمكانه أن يسكب مادة سائلة في أحد الأكواب على سبيل المثال. بعد تطوير فهم عام يمكّن من التمييز بين الأشياء التي تتيح إمكانية الاحتفاظ بالسوائل والأشياء التي لا تتيح ذلك، لن يكون الروبوت مضطراً ليخطئ تقدير موضع الكأس بشكل متكرر ويريق السائل على الطاولة في كل مرة لكي يتعلم كيفية تحقيق هدفه.

المحتوى محمي