نظام ذكاء اصطناعي يتقن لعبة الشطرنج بالقراءة عنها بدلاً من التدرب عليها

2 دقائق
رقعة شطرنج.

لا شيء يجلب السرور لعشاق الشطرنج أكثر من مناقشة إحدى التضحيات العبقرية للاعب بوبي فيشر، أو إحدى الخطط الهجومية المبتكرة من بطل العالم الحالي ماجنوس كارلسين. ويبدو أن هذه الثرثرة يمكن أن تساعد برامج الذكاء الاصطناعي على تعلم اللعبة بطريقة جديدة. ويوماً ما، يمكن لنفس الطريقة أن تسمح للآلات بالاستفادة من المحتوى العاطفي للغتنا لإتقان عدة مهام عملية.

تم تطوير خوارزمية الشطرنج هذه، التي تحمل اسم سينتيميت SentiMATE))، على يد الباحثين نيكولاس ماكارثي وإيزاك كامليش وإيزاك بينتاتا تشوكرون في جامعة لندن. وهي تقوم بتقييم مستوى حركات الشطرنج عن طريق تحليل ردود الفعل الصادرة عن معلقين خبراء.

قام الباحثون بتحليل نصوص تتضمن تعليقات على 2,700 لعبة شطرنج على الإنترنت. وبعد حذف التعليقات التي لا تتعلق بالحركات الممتازة، والأمثلة شديدة الغموض، قاموا باستخدام شبكة عصبونية تراجعية من نوع خاص مع تضمين الكلمات (وهي طريقة رياضية لوصل الكلمات معاً على أساس معانيها)، مع التدريب على نموذج حديث آخر لتحليل اللغة.

ومن قبلُ حقق الذكاء الاصطناعي تقدماً ملحوظاً في فهم اللغات؛ فمثلاً تستطيع خوارزمية من تطوير باحثين في الشركة البحثية أوبن إيه آي في سان فرانسيسكو أن تولد قصصاً إخبارية كاملة بالاعتماد على جملة من بضع كلمات فقط.

يقول الباحثون في رسالة بالبريد الإلكتروني إلى إم آي تي تكنولوجي ريفيو: "إن الخطوة التالية في تطوير معالجة اللغات الطبيعية هي تحويل هذه المعلومات الجديدة إلى أفعال ملموسة تساعد على حل مشاكل العالم الحقيقي. لقد شعرنا أن تعلم الإستراتيجية من البيانات النصية يمكن أن يكون مجالاً بحثياً هاماً يستحق الدراسة".

وقد فاجأت خوارزمية سينتيميت الباحثين بقدرتها على استنتاج بعض المبادئ الأساسية في الشطرنج، إضافة إلى عدة إستراتيجيات هامة، مثل هجوم الشوكة (أي تهديد قطعتين أو أكثر في نفس الوقت) والتبييت (أي تحريك الملك والرخ في الوقت نفسه إلى موقع ذي ميزات دفاعية أكبر في القسم الخلفي من الرقعة).

غير أن الخوارزمية ليست بمعلم شطرنج على الإطلاق، فقد فشلت بشكل متكرر في التغلب على بعض بوتات الشطرنج التقليدية. ولكن هذا البرنامج يمثل إمكانية استخدام اللغة للمساعدة على تعلم اللعبة بشكل جيد باستخدام بيانات تدريب واستطاعة حوسبة أقل مما تتطلبه الطرائق التقليدية.

لطالما كانت لعبة الشطرنج من الأساليب المستخدمة لقياس مدى التطور في الذكاء الاصطناعي، بدءاً من برنامج آلان تيورينج الذي كتبه على الورق في 1951 إلى هزيمة جاري كاسباروف على يد برنامج ديب بلو من آي بي إم.

ومؤخراً، استعرضت شركة ديب مايند التابعة لألفابيت نسخة شطرنج من ألفاجو، البرنامج الذي تمكن من تعليم نفسه كيفية ممارسة لعبة جو اللوحية الصينية القديمة. وقد زُوّد هذا البرنامج -الذي سُمِّيَ ألفازيرو- بقواعد اللعبة، ومن ثم طور مهاراته باللعب ضد نسخة أخرى من نفسه. ونظراً لكونه علم نفسه بنفسه، فقد تمكن من تطوير بعض الإستراتيجيات الغريبة والمفاجئة. ولكن على غرار ديب بلو، فقد احتاج ألفازيرو إلى الآلاف من شرائح وحدة معالجة تينسور (تي بي يو) الخاصة من جوجل، إضافة إلى بيانات من ملايين المباريات التدريبية.

ويقول الباحثون إن أساليب التعلم التي يعتمد عليها سينتيميت قد تتجاوز الشطرنج في تطبيقاتها العملية؛ فيمكن مثلاً أن تساعد الآلات على تحليل الأحداث الرياضية، وتوقع النشاط المالي، وتحسين التوصيات. كما يقولون: "إن هناك الكثير من الكتب والمدونات والأبحاث التي تنتظر استخدامها للتعلم".

المحتوى محمي