ألفا زيرو Alpha Zero

1 دقيقة

ما هو ألفا زيرو؟ 

هو برنامج حاسوبي تم إطلاقه لأول مرة في ورقة بحثية بعنوان "إتقان الشطرنج والشوجي من خلال اللعب الذاتي باستخدام خوارزمية التعلم المعزز العامة" بواسطة شركة أبحاث الذكاء الاصطناعي ديب مايند (DeepMind) في الخامس من ديسمبر/ كانون أول عام 2017 لإتقان ألعاب الشطرنج والشوجي (الشطرنج اليابانية) ولعبة غو.

كم عدد الألعاب التي لعبها ألفا زيرو؟

في الساعات التسع الأولى من وجوده، لعب 44 مليون لعبة شطرنج ضد نفسه. بعد ساعتين، كان أفضل من أي إنسان. بعد أربع ساعات، تغلب على أفضل برنامج شطرنج في العالم.

كيف تم تدريب ألفا زيرو؟

تتعلم محركات الشطرنج التي يتم تدريبها ذاتياً من خلال التعلم المعزز مثل ألفا زيرو تحديد الحركات وتقييم المواقف باستخدام البيانات التي تم إنشاؤها من خلال اللعب ضد أنفسها (المعروف باسم التدريب على اللعب الذاتي). أثناء التدريب على اللعب الذاتي، تنتقل الشبكة العصبونية الاصطناعية من التعلم العشوائي إلى القدرة على التحديد الذكي للحركة وتقييم الموقف بناءً على البصيرة. تتيح لنا عملية التدريب هذه "استرجاع التاريخ" للتعلم منه وعدم تكراره.

ألفا زيرو ضد ستوكفيش 

ظل تصور هزيمة محرك الشطرنج ستوكفيش يكاد يكون مستحيلاً، حتى ظهر ألفا زيرو في 2017 ليثبت العكس، في سلسلة من اثنتي عشرة مباراة من 100 جولة ضد ستوكفيش، فاز ألفا زيرو بـ 290 مباراة وتعادل بـ 886 وخسر 24 مرة.

المحتوى محمي