فريق من خوارزميات الذكاء الاصطناعي يقهر البشر في لعبة حاسوبية معقدة

اجتمعت خمس خوارزميات مختلفة للذكاء الاصطناعي حتى تلحق هزيمة نكراء بالبشر في دوتا 2، وهي لعبة حاسوبية استراتيجية ذائعة الصيت.

قام الباحثون في أوبن إيه آي، وهي مؤسسة غير ربحية في كاليفورنيا، بتطوير الفريق إيه للخوارزميات، والذي أطلقوا عليه اسم أوبن إيه آي فايف. تعتمد كل خوارزمية على شبكة عصبونية، لا تتيح لها تعلم كيفية اللعب وحسب، بل كيفية التعاون مع أفراد الفريق الآخرين من الخوارزميات المشابهة. وتقول أوبن إيه آي أن الفريق بدأ يتغلب على لاعبي دوتا 2 الهواة في الاختبارات.

يعتبر هذا التوجه جديداً وهاماً بالنسبة لأوبن إيه آي، بما أن الخوارزميات عادة ما تعمل بشكل منفرد. ويمكن للمقاربات القائمة على تعاون الخوارزميات فيما بينها أن تثبت أهميتها في بعض التطبيقات التجارية للتكنولوجيا. وعلى سبيل المثال، يمكن لخوارزميات الذكاء الاصطناعي أن تتعاون لتتغلب على الخصوم في التجارة أو مزايدة الإعلانات على الإنترنت. كما يمكن لهذه الخوارزميات أن تتعاون مع البشر أيضاً.

استعرضت أوبن إيه آي من قبل خوارزمية قادرة على التنافس ضد أفضل اللاعبين البشر في دوتا 2 بشكل منفرد. وهو أساس هذا المشروع الحالي، الذي يستخدم خوارزمية مشابهة ولكن تم تعديلها بحيث تعمل بشكل فردي وجماعي. ولا تتخاطب الخوارزميات فيما بينها بشكل مباشر، بل عن طريق اللعبة نفسها.

يقول جريج بروكمان، أحد مؤسسي أوبن إيه آي، والتي تهدف إلى تطوير الذكاء الاصطناعي بشكل مفتوح ومفيد للبشرية: "ما رأيناه يقتضي أن التعاون والتنسيق يمكن أن ينشأ بشكل طبيعي بوجود حوافز كافية". ويضيف أن الفريق جرب استبدال إحدى الخوارزميات بلاعب بشري، وأن هذه التجربة نجحت إلى حد كبير: "لقد أحس اللاعب بأنه يحظى بالكثير من الدعم، على حد وصفه".

دوتا 2 لعبة حاسوبية استراتيجية معقدة، حيث تتنافس فرق من خمسة لاعبين على السيطرة على بنية ضمن مساحة شاسعة الامتداد. يتمتع اللاعبون بنقاط قوة وضعف مختلفة، وأدوار متباينة، وتتضمن اللعبة جمع أشياء والتخطيط للهجمات، إضافة إلى القتال في الزمن الحقيقي.

أصبحت تجربة برامج الذكاء الاصطناعي في الألعاب الحاسوبية أسلوباً شائعاً لقياس مدى التقدم. فقد قامت ديب مايند، وهي شركة تابعة لشركة ألفابيت، بتطوير برنامج شهير قادر على تعلم كيفية ممارسة اللعبة اللوحية "جو" شديدة التعقيد والدقة، وبمهارة خارقة تتجاوز القدرات البشرية. وبعد ذلك، قام برنامج مشابه بتعليم نفسه من الصفر كيفية إتقان لعبة جو، ومن ثم الشطرنج، وذلك باللعب ضد نفسه وحسب.

صحيح أن الخوارزميات المطلوبة في دوتا 2 أكثر تحديداً مما في الشطرنج أو جو، ولكن إتقانها ما زال أمراً صعباً. كما أنه يمثل تحدياً للآلة على وجه الخصوص، لأنه ليس من الممكن دائماً أن ترى ما يفعله خصومك، إضافة إلى ضرورة العمل الجماعي. تعلم فريق أوبن إيه آي فايف اللعب عن طريق التنافس مع نسخ متنوعة من نفسه، ومع مرور الوقت، طور البرنامج استراتيجيات مشابهة لتلك التي يستخدمها البشر، مثل إيجاد وسائل للحصول على الذهب عن طريق "زراعته" على سبيل المثال، أو اعتماد دور استراتيجي أو "منحى" ضمن اللعبة.

يعتبر خبراء الذكاء الاصطناعي أن هذا الإنجاز هام. يقول نوام براون، باحث في جامعة كارنيجي ميلون في بيتسبيرج: "تتصف دوتا 2 بتعقيد شديد، وبالتالي فإن مجرد التغلب على الهواة المهرة إنجاز مثير للإعجاب. وعلى وجه الخصوص، يعتبر التعامل مع المعلومات المخبأة في لعبة بهذه الضخامة تحدياً كبيراً".

عمل براون من قبل على خوارزمية قادرة على لعب البوكر -وهي لعبة أخرى تعتمد على المعلومات الناقصة- بمهارة تتخطى مهارة البشر (أنظر مقالة "لماذا يعتبر البوكر هاماً في مجال الذكاء الاصطناعي"). ويقول براون أنه إذا تمكن فريق أوبن إيه آي فايف من التغلب على البشر بشكل مستمر، فهذا سيكون مأثرة في مجال الذكاء الاصطناعي. غير أنه يلحظ أن اللاعبين البشر، مع مرور الوقت، قد يتمكنون من كشف نقاط الضعف في أسلوب لعب فريق الذكاء الاصطناعي.

يمكن لألعاب أخرى أن تدفع بالذكاء الاصطناعي نحو الأمام أكثر من ذي قبل. يقول براون أخيراً: "التحدي المقبل الكبير سيكون الألعاب التي تتطلب الاتصال، مثل ديبلوماسي أو سيتلرز أوف كاتان، حيث يعتمد النجاح على التوازن ما بين التعاون والمنافسة".