5 نماذج ذكاء اصطناعي تُتيح للروبوتات تأدية مهام في بيئات غير مألوفة

3 دقيقة
5 نماذج ذكاء اصطناعي تُتيح للروبوتات تأدية مهام في بيئات غير مألوفة
مصدر الصورة: سارة روجرز/ إم آي تي تكنولوجي ريفيو | غيتي إميدجيز

ملخص: أصبح بالإمكان تدريب الروبوتات على أداء مهام محددة بمستوى جيد من الإتقان، لكن بيئة العمل ما زالت تمثل مشكلة، حيث يحتاج الروبوت إلى تعديلات أو بيانات إضافية لأداء هذه المهام في بيئة جديدة، وهو أمر صعب لأن جمع البيانات المطلوبة يتطلب عملاً فيزيائياً، على عكس البيانات المستخدمة في تدريب النماذج اللغوية الكبيرة، التي يمكن جمعها مباشرة من الإنترنت. هنا يأتي دور نماذج المنفعة الروبوتية الخمسة التي طورها فريق من الباحثين لتأدية 5 مهام مختلفة (فتح الأبواب والأدراج والتقاط المناديل والأكياس والأجسام الأسطوانية) ضمن العديد من البيئات المختلفة. جمع الفريق البيانات اللازمة للعمل بإجراء 1,000 تجربة تقريباً لكل من هذه المهام في 40 بيئة مختلفة، وتمكّن من تحقيق نسبة نجاح بلغت 74.4%، ورفعها إلى 90% بالاستعانة بنموذج لغوي كبير، يتم سؤاله في حال أخطأ الروبوت، فيجيب، ويعيد الباحثون الاختبار.

ليس من السهل جعل الروبوتات تنفذ أي مهمة في بيئات غير مألوفة بالنسبة لها، وعادة ما يحتاج الباحثون إلى تدريب هذه الروبوتات باستخدام بيانات جديدة في كل مرة يضعون هذه الروبوتات في مكان جديد، وهي مهمة قد تتحول إلى عبء مكلف جداً ويستغرق وقتاً طويلاً.

أما الآن، فقد طور الباحثون سلسلة من نماذج الذكاء الاصطناعي التي تعلم الروبوتات كيفية إنجاز المهام الأساسية ضمن بيئات جديدة دون الحاجة إلى المزيد من التدريب أو الضبط الدقيق. تتألف هذه السلسلة من 5 نماذج ذكاء اصطناعي تحمل اسم "نماذج المنفعة الروبوتية" (robot utility models)، أو اختصاراً "روم" (RUMs)، وهي تسمح للآلات بإنجاز خمس مهام منفصلة: فتح الأبواب والأدراج، والتقاط المناديل والأكياس والأجسام الأسطوانية ضمن بيئات غير مألوفة، وبنسبة نجاح تبلغ 90%.

اقرأ أيضاً: اكتشف الروبوتات الهجينة التي تحاكي الكائنات الحية

إنجاز مهام منفصلة في بيئات غير مألوفة بالنسبة للروبوتات

يتألف فريق الباحثين من باحثين من جامعة نيويورك، وشركة ميتا (Meta)، وشركة الروبوتات هيلو روبوت (Hello Robot)، ويأمل الفريق بأن تؤدي النتائج التي توصل إليها إلى جعل تعليم الروبوتات مهارات جديدة عملية أسرع وأسهل، مع مساعدتها على العمل ضمن بيئات غير معروفة بالنسبة لها. يمكن أن يؤدي هذا الأسلوب إلى جعل استخدام الروبوتات في منازلنا في المستقبل أسهل وأقل تكلفة.

يقول طالب الدكتوراة في جامعة نيويورك، ماهي شفيع الله، وهو أحد المشاركين في المشروع: "في الماضي، كان الناس يركزون كثيراً على معضلة جعل الروبوتات قادرة على فعل كل شيء، لكنهم لم يركزوا فعلياً على كيفية جعل الروبوتات تفعل الأشياء التي تتقنها، في كل مكان. أما نحن، فقد درسنا كيف يمكن تعليم الروبوت مهارة فتح أي باب في أي مكان، على سبيل المثال".

معضلة البيانات: المشكلة التي تواجه تدريب الروبوتات

عموماً، يتطلب تعليم الروبوتات مهارات جديدة كميات كبيرة من البيانات، غير أنه لا يمكن العثور على هذه البيانات بسهولة على الإطلاق. ونظراً إلى أن الحصول على بيانات التدريب الخاصة بالروبوتات يتطلب جمعها فيزيائياً –وهي عملية مكلفة وتستغرق وقتاً طويلاً- فإن بناء مجموعات البيانات التدريبية وزيادة حجمها مسألة أصعب بكثير مما في حالة أنواع أخرى من الذكاء الاصطناعي، مثل النماذج اللغوية الكبيرة التي يجري تدريبها على معلومات يمكن جمعها من الإنترنت.

ولزيادة سرعة جمع البيانات الضرورية لتعليم الروبوت مهارة جديدة، طور الباحثون نسخة جديدة من أداة جرى استخدامها في بحث سابق، وهي هاتف آيفون متصل بعصا مساعدة للوصول إلى الأغراض البعيدة والإمساك بها زهيدة الثمن من الأنواع المستخدمة عادة في جمع المهملات.

استخدم الفريق هذه الأداة لتسجيل ما يقرب من 1,000 تجربة لكل من المهام الخمس في 40 بيئة مختلفة، بما في ذلك بعض المنازل في مدينتَي نيويورك وجيرسي، وقد جرى جمع جزء من هذه البيانات في إطار أبحاث سابقة. بعد ذلك، درب الفريق خوارزميات تعلّم باستخدام مجموعات البيانات الخمس لبناء نماذج روم.

اقرأ أيضاً: كيف تستخدم ميتا بياناتك لتدريب الذكاء الاصطناعي؟ وكيف يمكن منع ذلك؟

التدريب بالاستعانة بالنماذج اللغوية الكبيرة

جرى تطبيق هذه النماذج على الروبوت ستريتش (Stretch)، وهو روبوت مؤلف من وحدة مزودة بعجلات، وعمود طويل، وذراع قابلة للطي وتحمل هاتف آيفون، وذلك لاختبار مدى نجاح هذه النماذج في تنفيذ المهام في بيئات جديدة دون تعديلات إضافية. حققت النماذج معدل نجاح بلغ 74.4% في إنجاز هذه المهام، لكن الباحثين تمكنوا من زيادة هذه النسبة إلى 90% عندما التقطوا صوراً باستخدام هاتف آيفون والكاميرا المحمولة على رأس الروبوت، ولقموها للنموذج اللغوي الكبير الحديث من شركة أوبن أيه آي (OpenAI)، جي بي تي 4 أو (GPT-4o)، وسألوا النموذج إن كانت المهمة قد اكتمل إنجازها بنجاح. عندما كان جي بي تي 4 أو يجيب بالنفي، كان الباحثون يكتفون بإعادة ضبط الروبوت، وتنفيذ محاولة أخرى.

إن تدريب النماذج واختبارها في البيئات المخبرية لا يمثل ما يمكن أن يحدث في العالم الحقيقي، وهذه المسألة من أكبر التحديات التي يواجهها مختصو الروبوتات، وتعني أن أوساط الباحثين في هذا المجال ترحب بأي بحث يمكن أن يساعد الآلات على أن تسلك سلوكاً أكثر موثوقية في البيئات الجديدة، على حد قول عالم الأبحاث المختص بمهارات المناولة والإمساك في الروبوتات (robotic manipulation)، موهيت شريدار، الذي لم يشارك في المشروع.

ويقول: "من الرائع أن يجري تقييم هذا العمل في كل تلك البيئات المتنوعة من منازل ومطابخ، لأننا إذا تمكنّا من تشغيل روبوت في العالم الحقيقي ضمن أي منزل عشوائي، فإن هذا يعني تحقيق الهدف الحقيقي لحقل الروبوتات".

يمكن أن يتحول هذا المشروع إلى وصفة عامة تتيح بناء نماذج منفعة روبوتية جديدة مخصصة لمهام أخرى، بحيث تساعد على تعليم الروبوتات مهارات جديدة من خلال بذل أقل جهد إضافي ممكن، وتساعد الناس من غير المختصين بالروبوتات على استخدام الروبوتات في منازلهم في المستقبل على نحو أسهل، على حد قول شفيع الله.

ويقول: "الحلم الذي نسعى إلى تحقيقه هو إمكانية إجراء عملية تدريبية خاصة بمهمة ما، ونشر النموذج الخاص بها عبر الإنترنت، بحيث يتمكن أي شخص من تنزيله وتشغيله على روبوت في منزله".