تؤدي الروبوتات دوراً كبيراً في التحول الرقمي في العديد من القطاعات في الصناعة، فقد بات العديد من المصانع والمستودعات توظف عدداً كبيراً من الروبوتات لإنجاز بعض الأعمال. مع ذلك، ظهرت مشكلة بين الروبوتات أو الطائرات المسيرة العديدة التي يجب أن تقوم بعمل تعاوني، وهي عدم فعالية التواصل فيما بينها.
في هذه الحالة، يرغب مالكو المصانع، خاصة أولئك الذين ينتجون منتجات دقيقة مثل الرقاقات الإلكترونية، بأن تكون الروبوتات متعاونة مع بعضها بسرعة وقوة وكفاءة أكثر من البشر دون أن يكون ثمة اتصال فيما بينها، وذلك لأن جميع الروبوتات أو الطائرات المسيرة لا تملك الأدوات اللازمة لذلك، أو قد تكون الإشارة فيما بينها عرضة للتشويش، ما يجعل تواصلها مع بعضها مستحيلاً.
خوارزمية تعلّم معزز جديدة تبث روح الفريق بين الروبوتات
من هذا المنطلق، طوّر فريقٌ من الباحثين في كلية غرينجر للهندسة بجامعة إلينوي في مدينة أوربانا الواقعة في مقاطعة شامبين الأميركية، طريقة يمكن من خلالها تدريب وكلاء متعددين مثل الروبوتات والطائرات المسيّرة على العمل التعاوني مع انخفاض طفيف في الكفاءة، دون أن يكون هناك اتصال فيما بينها، بالاعتماد على طريقة تسمى "التعلّم المعزز متعدد العوامل" (MARL).
التعلّم المعزز متعدد العوامل هو نوع من التعلّم المعزز، وهو بدوره من أنواع التعلّم الآلي، يتعلم فيه الروبوتات بناءً على التكرارات السابقة لفعل معين، وفيه يحصل الروبوت أو الطائرة المسيرة على مكافأة عند قيامه بعمل إيجابي للفريق. هذه التقنية فريدة من نوعها، وقد وضح الفريق آلية عملها في الدراسة المنشورة على موقع arxiv.
التدريب على العمل التعاوني بين الروبوتات
لم يكن مفهوم الفريق أحد المفاهيم المستخدمة على نطاق واسع في مجال الروبوتات من قبل، فمعظم الروبوتات مبرمجة لإنجاز وظائف فردية، ولا يعرف أحدها ما يجب أن يفعله عندما يواجه روبوتاً آخر.
وقد قال مهندس الطيران في الفريق هوي تران: "مع أهداف الفريق، من الصعب معرفة من ساهم في الفوز. لقد طوّرنا تكنولوجيا التعلّم الآلي التي تسمح لنا بتحديد متى يساهم وكيل فردي في هدف الفريق الجماعي".
وللتوضيح، يطرح تران مثالاً فيقول: "إذا نظرت إلى الأمر من منظور الرياضة، فقد يسجل لاعب كرة قدم واحد الهدف، لكننا نريد أيضاً معرفة الإجراءات التي ينفذها زملاؤه في الفريق والتي أدت إلى الهدف، مثل التمريرات. من الصعب فهم هذه الآثار المتأخرة". وأضاف شارحاً أنهم ركزوا على المواقف التي لا يكون فيها من الواضح ما هي الأدوار أو الوظائف المختلفة للوكلاء.
نظر الباحثون أيضاً باحتمالية أن يحقق فريق الروبوتات الأهداف بغض النظر عن تواصلها مع بعضها. في هذه الحالة كانوا يحصلون على تعزيز سلبي، ودربوا نموذج التعلّم الآلي على الإجراءات التي لا تساهم في هدف الفريق، وبالتالي لن تحتاج الروبوتات إلى إشارة بأن هذا التصرف سلبي ويجب أن تتجنبه، أي أن الباحثين دربوا الروبوتات مراراً على تجنب الإجراءات التي لا تساهم في تحقيق هدف الفريق ككل.
العمل بروح الفريق ليس من طبيعية الروبوتات، ويمكن توضيح ما قام به الفريق بتشبيهه بالطفل الصغير الذي تحاول أن تُخلصه من أنانيته وتعزز لديه روح العمل التعاوني، فأنت تلعب مع الطفل باستمرار، وتعلمه عن طريق تعزيز تصرفاته الإيجابية، وتراقب التطور في استجابته للتدريبات، حتى يتعلم اللعب مع الفريق.
التدريب العملي
كانت كرة القدم مجرد مثال للتوضيح، لكن الفريق درّب الروبوتات على نوعين من الإلكترونيات، الأولى محاكاة للعبة تسمى الإمساك بالعَلم (Capture The Flag)، يؤديها عادةً فريقان يحاول كل منهما الإمساك بعلم الفريق الآخر. والثانية لعبة خيال علمي حاسوبية حربية، يمكن أن تؤدى على شكل فرق وتسمى ستار كرافت (StarCraft)، وكانت طريقة تعاون الروبوتات غير متوقعة، خاصة في اللعبة الأخيرة، أي أن هذه الروبوتات لها توجه قوي للعمل كفريق عندما تُطرح في العالم الحقيقي.
اقرأ أيضاً: هل البساطة هي المفتاح إلى تعاون روبوتي أكثر ذكاءً؟
التطبيقات المستقبلية المحتملة
تساهم هذه التقنية في مشاركة الروبوتات بشكل أكبر في الأعمال التي تتطلب عملاً جماعياً تعاونياً، مثل المصانع والمستودعات. بالإضافة إلى ذلك، يمكن استخدام هذه الروبوتات التعاونية في العديد من المواقف الواقعية كتلك التي تحتاج إلى المزيد من القيادة والتحكم، والمواقف الحرجة التي تحتاج إلى اتخاذ القرار دون اتصال، مثل طائرات المراقبة العسكرية المسيرة، وتشغيل شبكة الطاقة الكهربائية، وفي أنظمة التحكم في المركبات ذاتية القيادة خاصة فيما يتعلق ببروتوكولات السلامة في البيئات المعقدة.
اقرأ أيضاً: ماذا لو استطعنا خلق التعاون بين الروبوتات والسيارات ذاتية القيادة في توصيل الطرود؟
قد يستغرق 'طرح هذه التكنولوجيا في سوق العمل بعض الوقت، لكنها بالتأكيد تطور إيجابي في خوارزميات الذكاء الاصطناعي والتعلّم الآلي، وقد تؤدي إلى مستوى جديد من التحول الرقمي، وستكون تأثيراتها السلبية على الإنتاج ضئيلة، وستقل احتمالية التدخل البشري في عملها.