ديب مايند تُعلّم الذكاء الاصطناعي احتراف لعبة تفوق لعبة “غو” صعوبة

1 دقيقة

لو لعبت يوماً بلعبة الورق هانابي (Hanabi)، لأدركت أنّها لا تشبه أي لعبة أخرى، إذ أنها لعبة تعتمد على التعاون، يكون لديك فيها رؤية كاملة لما في أيدي الآخرين من أوراق، لكن من دون أن تعلم ما بحوزتك.

يعتقد الباحثون في فريق جوجل برين (Google Brain) وشركة ديب مايند (DeepMind) أنها اللعبة المثالية التي يجب أن يتعامل معها الذكاء الاصطناعي الآن، لأنها تعد تدريباً فعالاً للتفكير الاستراتيجي والقدرة على الاستنتاج والتعاون. فمن أجل الفوز باللعبة، على كل لاعب أن يقدم للاعبين الآخرين تلميحات عما في أيديهم من أوراق خلال عدد محدود من الأدوار أو المرّات وذلك بغرض ترتيب كامل الأوراق.

يقول الباحثون في ورقة منشورة حديثة، إنه خلافاً لألعاب أخرى احترفها الذكاء الاصطناعي كالشطرنج ولعبة غو والبوكر، فإن لعبة هانابي تتطلب مستوى أعلى من التفكير والمنطق، فضلاً عن تطلبها لنظرية العقل، التي تتضمن فهم الحالة الفكرية للآخرين، وفهم إمكانية كونها مختلفة عن الحالة الفكرية للاعب. تعد نظرية العقل مهارة أساسية يستخدمها البشر لكي يعملوا بشكل فعال في العالم، وعادة ما يتم اكتسابها في عمر مبكر.

كنتيجة لكون المعلومات في هانابي محدودة بعدد التلميحات المقدمة إلى اللاعبين في كل لعبة وبالمضمون الذي يمكن إيصاله في كل تلميح، على أداة الذكاء الاصطناعي أن تجمع المعلومات الضمنية من أفعال اللاعبين الآخرين لربح اللعبة، الأمر الذي يعتبر تحدياً لم يسبق للذكاء الاصطناعي أن واجهه من قبل.

إضافة لذلك، على الذكاء الاصطناعي أن يتعلم كيفية تقديم أكبر قدر ممكن من المعلومات عبر تلميحاته وأفعاله لمساعدة اللاعبين الآخرين على الفوز، ويعتقد الباحثون أنه لو تمكنت أداة الذكاء الاصطناعي من النجاح بذلك في بيئة إيصال معلومات غير مثالية كهذه، فإنها ستكون أقرب إلى التعامل بشكل فعال مع البشر.

تعتبر كل هذه تحديات جديدة للمجتمع البحثي، وستتطلب تطويرات جديدة للخوارزميات من أجل الربط بين عمل عدة مجالات من الذكاء الاصطناعي، التي تتضمن التعليم المعزّز، ونظرية الألعاب، والتواصل الناشئ وهو دراسة الكيفية التي ينشأ فيها التواصل بين عدة أدوات ذكاء اصطناعي في إطار التعاون.

وقد قام فريق جوجل باختبار أحدث نظريات التعليم المعزّز للتأكد من هذه الفرضية ووجد أن هذه النظريات ذات أداء سيء. نتيجة لذلك، نشر الفريق بيئة هانابي مفتوحة المصدر لتحفيز المزيد من العمل ضمن المجتمع البحثي.

يقول جاكوب فويرستر عن ذلك: "لطالما كنت مبهوراً كباحث بإمكانية أن تتعلم أدوات الذكاء الاصطناعي التواصل والتعاون بين بعضها ومن ثم مع البشر، وإن لعبة هانابي تقدم فرصة مميزة كتحدي كبير في هذه المجال".

المحتوى محمي