ما زالت "ديب مايند" (DeepMind) تواصل عملها في تطبيق أنظمتها المتطورة للذكاء الاصطناعي لحل المشاكل العلمية الصعبة. وفي مشروع مشترك مع المركز السويسري للبلازما في المعهد السويسري الفيدرالي للتكنولوجيا في لوزان بسويسرا، قامت شركة الذكاء الاصطناعي التي تعمل في بريطانيا الآن بتدريب خوارزمية باستخدام التعلم المعزز العميق للتحكم في الحساء فائق السخونة من المواد التي تسبح ضمن مفاعل الاندماج النووي. ويمكن أن يكون هذا العمل، والذي نُشر في مجلة "نيتشر" (Nature)، أداة تساعد الفيزيائيين على تحقيق فهم أفضل لطبيعة الاندماج، كما يمكن أن يؤدي إلى تسريع الحصول على مصدر غير محدود من الطاقة النظيفة.
تطبيق للتعلم المعزز في العالم الحقيقي
يقول مارتن ريدميلر، وهو باحث في ديب مايند: "هذا من أصعب التطبيقات للتعلم المعزز في نظام من العالم الحقيقي".
ففي الاندماج النووي، تُدفع نوى ذرات الهيدروجين إلى الاتحاد معاً لتشكل ذرات أثقل، مثل الهيليوم. وهو ما يؤدي إلى إنتاج كمية كبيرة من الطاقة بالنسبة إلى مقدار صغير من الوقود، ما يجعله مصدراً فائق الفعالية للطاقة. كما أنه أكثر نظافة وأماناً بكثير من الوقود الأحفوري أو الطاقة النووية التقليدية، والتي تعتمد على الانشطار النووي، أي دفع النوى إلى الانقسام. إضافة إلى ذلك، فإن الاندماج هو العملية التي تكسب النجوم طاقتها.
ولكن التحكم في الاندماج النووي على الأرض مسألة صعبة للغاية. وتكمن المشكلة في أن النوى الذرية تنبذ بعضها بعضاً. ولا يمكن دفعها نحو الاندماج داخل المفاعل إلا ضمن درجات حرارة فائقة الارتفاع، وغالباً ما تصل إلى ملايين الدرجات، أي أكثر سخونة من مركز الشمس. وعند هذه الحرارة، لا تأخذ المادة الشكل الصلب أو السائل أو الغازي. بل تدخل حالة رابعة تعرف باسم البلازما، وهي أقرب إلى حساء عكر وشديد السخونة من الجسيمات.
اقرأ أيضاً: هل نشهد الأيام الأخيرة لنجم “منكب الجوزاء”؟
كيف يعمل النظام؟
وتتلخص المهمة بالحفاظ على البلازما داخل المفاعل لفترة طويلة لاستخراج الطاقة منها. فداخل النجوم، تتكفل الجاذبية بمهمة تجميع وتركيز البلازما. أما على الأرض، فيستخدم الباحثون عدة أنواع من الحيل، بما في ذلك الليزرات والمغانط. ففي المفاعل المغناطيسي، والمعروف باسم توكاماك، تُحتبس البلازما داخل قفص كهرطيسي، ما يرغمها على اتخاذ شكل القفص نفسه ويمنعها من ملامسة جدران المفاعل، ما قد يؤدي إلى تبريد البلازما وإيذاء المفاعل.
ويتطلب التحكم في البلازما مراقبة مستمرة للتلاعب المتواصل بالحقل المغناطيسي. وقد قام الفريق بتدريب خوارزمية التعلم العميق المعزز على القيام بهذا في إطار محاكاة حاسوبية. وما إن تعلمت الخوارزمية كيفية التحكم في شكل البلازما -وتغييره- ضمن مفاعل افتراضي، قام الباحثون بتسليمها زمام التحكم في المغانط في مفاعل توكاماك متغير التركيبة (تي سي في)، وهو مفاعل تجريبي في لوزان. ووجدوا أن الذكاء الاصطناعي تمكن من التحكم في المفاعل الحقيقي دون أي تعديلات دقيقة إضافية. وبالإجمال، قام الذكاء الاصطناعي بالتحكم في البلازما لثانيتين فقط، ولكن هذه هي الفترة التي يستطيع مفاعل "تي سي في" العمل خلالها قبل أن تتجاوز سخونته الحد المطلوب.
وتقوم الشبكة العصبونية المدربة بأخذ 90 قياساً مختلفاً لتوصيف شكل البلازما وموضعها بوتيرة عشرة آلاف مرة في الثانية، وذلك لتعديل الجهد الكهربائي في 19 مغناطيساً استجابةً لهذه التغيرات. وهذه الحلقة المغلقة من التغذية العكسية أكثر سرعة بكثير مما كانت خوارزميات التعلم المعزز السابقة تتعامل معه. ولتسريع العمل، تم تقسيم نظام الذكاء الاصطناعي إلى شبكتين عصبونيتين. وتقوم الشبكة الكبيرة، والتي تحمل اسم الناقد، بتعلم كيفية التحكم بالمفاعل داخل محاكاة حاسوبية عبر التجربة والخطأ. وبعد ذلك، تم ترميز قدرة الناقد ضمن شبكة أصغر وأسرع تحمل اسم المنفذ، وهي التي تقوم بتشغيل المفاعل نفسه.
اقرأ أيضاً: ما الدافع وراء قرار فرنسا بالعودة إلى استخدام الطاقة النووية؟
الذكاء الاصطناعي حيث لا يستطيع البشر التلاعب
يقول جوناثان سيترين في المعهد الهولندي لأبحاث الطاقة الأساسية، والذي لم يشارك في هذا العمل: "إنها طريقة فائقة الفعالية، وهي خطوة أولى مهمة في اتجاه مثير للحماس".
يعتقد الباحثون أن استخدام الذكاء الاصطناعي للتحكم بالبلازما سيسهل إجراء التجارب مع أوضاع مختلفة داخل المفاعلات، ما يساعد العلماء على فهم العملية، وقد يؤدي إلى تسريع تطوير المفاعل الاندماجي التجاري. إضافة إلى ذلك، فقد تعلم الذكاء الاصطناعي كيفية التحكم في البلازما بتعديل المغانط بطريقة لم يفكر بها البشر من قبل، ما يشير إلى احتمال وجود تراكيب جديدة يمكن تجريبها للمفاعلات.
يقول أمبروغيو فاسولي، وهو مدير مركز البلازما السويسري ورئيس مجلس إدارة مجموعة يوروفيوجن: "يمكننا بوجود هذا المستوى من السيطرة والتحكم المجازفة بأمور لم نكن لنجرؤ عليها عادة". فغالباً ما يفضل المشرفون البشر عدم دفع البلازما إلى خارج حدود معينة. ويقول: "هناك أحداث يجب أن نتجنبها بأي ثمن لأنها تضر بالمفاعل. وإذا كان لدينا نظام تحكم مضمون يستطيع الاقتراب من الحدود دون تجاوزها، فإن هذا سيتيح دراسة المزيد من الاحتمالات، وسيصبح بإمكاننا تسريع البحث".