هل البساطة هي المفتاح إلى تعاون روبوتي أكثر ذكاءً؟

فكر في كل العمليات التي تقوم بها في اللاوعي أثناء القيادة؛ فمع تلقيك للمعلومات حول السيارات المحيطة بك، تتوقع كيف يمكن أن تتحرك هذه السيارات، وتفكر على الفور كيف ستستجيب لهذه التحركات، بل يمكن أن تفكر حتى في تأثيرك على السائقين الآخرين بناء على ما يعتقدون أنك ستفعله.

إذا كانت الروبوتات ستندمج بسلاسة في هذا العالم، فيجب أن تقوم بشيء مشابه أيضاً. والآن، اقترح باحثون من جامعة ستانفورد ومعهد فيرجينيا للتكنولوجيا طريقة جديدة لمساعدة الروبوتات على تأدية هذا النوع من النمذجة السلوكية، وسيقدمون هذه الطريقة قريباً في المؤتمر السنوي الدولي حول التعلم الروبوتي.

تتضمن هذه الطريقة قيام الروبوتات بتلخيص الملامح العامة فقط لتحركات الأطراف الأخرى فقط، بدلاً من التقاط التفاصيل الدقيقة. يسمح هذا للروبوتات بمزيد من السرعة في توقع الأفعال المستقبلية وتخطيط استجاباتها دون إرهاق نفسها بعبء ضخم من الحوسبة.

نظرية عقل مختلفة

تستوحي النماذج التقليدية لمساعدة الروبوتات على العمل مع البشر أفكارَها من إحدى أفكار علم النفس، التي تسمى: نظرية العقل. تقول هذه النظرية إن الأشخاص يتفاعلون ويتعاطفون مع بعضهم البعض عن طريق تطوير استيعابهم لمعتقدات بعضهم البعض، وهي مهارة نقوم بتطويرها أثناء الطفولة. وقد ركز الباحثون الذين استلهموا عملهم من هذه النظرية على جعل الروبوتات تقوم ببناء نموذج لنوايا الروبوتات الأخرى المتعاونة واستخدامه كأساس لتوقع أفعالها.

غير أن دورسا ساديج، وهي أستاذ مساعد في ستانفورد، تعتقد أن هذه الطريقة غير فعالة. وتقول: “إذا فكرنا في التفاعل بين البشر، فهذا ليس ما نقوم به فعلياً، فإذا كنا نحاول تحريك طاولة سوياً، فإننا لا نقوم بنمذجة معتقدات بعضنا البعض”. وبدلاً من ذلك، كما تقول، يعتمد الشخصان أثناء تحريك الطاولة على إشارات بسيطة، مثل القوى التي يشعران بها من قيام الشخص الآخر بدفع أو سحب الطاولة: “أعتقد أن ما يحدث فعلاً أثناء أداء البشر لمهمة ما سوياً هو تتبع شيء ذي بعد أخفض بكثير”.

وباستخدام هذه الفكرة، يمكن للروبوت أن يخزن توصيفات بسيطة للغاية حول أفعال الأطراف الأخرى المحيطة به. وعلى سبيل المثال، في لعبة هوكي الطاولة، يمكن للروبوت تخزين تحركات خصمه بكلمة واحدة فقط: يمين، يسار، وسط. يستطيع الروبوت بعد ذلك استخدام هذه البيانات لتدريب خوارزميتين منفصلتين: خوارزمية تعلم آلي تتوقع التحرك التالي للخصم، وخوارزمية تعلم معزز تحدد كيفية الاستجابة. تستطيع الخوارزمية الثانية أيضاً متابعة تغيرات تحركات الخصم بناء على استجابتها الخاصة، وبالتالي يمكنها أن تتعلم كيفية التأثير على أفعال الخصم.

تكمن الفكرة الأساسية هنا في خفة بيانات التدريب، ما يسمح للروبوت بتنفيذ هذا التدريب الموازي على الفور. قد تنطوي المقاربة الأقرب إلى الشكل التقليدي على تخزين إحداثيات جميع تحركات الخصم، ليس فقط الاتجاه العام لها. وعلى الرغم من أن الاعتماد على بيانات أقل قد يبدو معاكساً للمنطق البديهي، فعلينا ألا ننسى نظرية ساديج حول التفاعل البشري؛ فنحن أيضاً نقوم بنمذجة البشر من حولنا باستخدام ملامح عامة وحسب.

أجرى الباحثون عمليات محاكاة لاختبار هذه الفكرة في تطبيقات مثل السيارات ذاتية القيادة، وفي العالم الحقيقي في لعبة هوكي الطاولة للروبوتات. وفي كل من التجربتين، تفوقت الطريقة الجديدة في الأداء على الطرق السابقة لتعليم الروبوتات التكيف مع الأطراف المحيطة بها. تعلم الروبوت أيضاً، وبفعالية، كيفية التأثير على الأطراف المحيطة به.

الأعمال اللاحقة

ما زالت هناك بعض المشاكل التي يجب على الأبحاث اللاحقة حلها. وعلى سبيل المثال، يفترض العمل الحالي أن جميع التفاعلات التي يخوضها الروبوت محدودة، وذلك وفقاً لجايكوب فورستر، الأستاذ المساعد في جامعة تورونتو، والذي لم يشارك في هذا العمل.

ففي محاكاة السيارات ذاتية القيادة، افترض الباحثون أن السيارة الروبوتية كانت تخوض فقط تفاعلاً واحداً واضح الحدود مع سيارة أخرى خلال كل جولة من التدريب. ولكن القيادة الواقعية تختلف جذرياً عن هذا الوضع؛ حيث إن التفاعلات تكون متواصلة في أغلب الأحيان، وتتطلب من السيارة ذاتية القيادة أن تتعلم وتكيف سلوكها خلال التفاعلات كل على حدة، وليس خلال الفواصل الزمنية التي تفصل بين هذه التفاعلات وحسب.

أما التحدي الآخر، كما تقول ساديج، فهو أن المقاربة تفترض وجود معرفة بأفضل طريقة لتوصيف سلوك الأطراف الأخرى المتعاونة؛ فقد اضطر الباحثون أنفسهم للتوصل إلى تصنيفات “يمين” و”يسار” و”وسط” في لعبة هوكي الطاولة حتى يتمكن الروبوت من توصيف سلوك الخصم. غير أن هذه التصنيفات لن تكون على الدوام بهذا الوضوح في التفاعلات الأكثر تعقيداً.

على كل حال، يرى فورستر أن هذا البحث يمثل عملاً واعداً. ويقول: “إن ردم الهوة ما بين التعلم متعدد الأطراف والتفاعل بين البشر والذكاء الاصطناعي يمثل مجالاً هاماً للغاية للأبحاث في المستقبل. وأشعر بحماس كبير إزاء الجمع ما بين هذه الأفكار”.