تستمر شركة ديب مايند (DeepMind) في إجراء المزيد من الاكتشافات في أساسيات علوم الحاسوب؛ إذ استخدمت الشركة في عام 2022 نسخة من برنامج الذكاء الاصطناعي الذي يمارس الألعاب، ألفا زيرو (AlphaZero)، للتوصل إلى طرق جديدة لتسريع عملية إجراء حسابات رياضية محددة بالغة الأهمية يعتمد عليها العديد من أنواع الرموز البرمجية المختلفة، محطّمةً بذلك رقماً قياسياً عمره 50 عاماً.
والآن، كررت ديب مايند هذا الإنجاز مرتين. اكتشف الخبراء في هذه الشركة التي مقرها المملكة المتحدة (والتي أعيدت تسميتها مؤخراً إلى جوجل ديب مايند، Google DeepMind، بعد اندماجها مع مختبر الذكاء الاصطناعي التابع لشركتها الشقيقة في أبريل/ نيسان 2023) طريقة لترتيب العناصر في القوائم أسرع بنسبة تصل إلى 70% من أسرع طريقة متوفرة حالياً باستخدام إصدار جديد من برنامج ألفا زيرو يحمل اسم ألفا ديف (AlphaDev).
اقرأ أيضاً: بوت دردشة جديد من ديب مايند يعتمد على عمليات بحث جوجل وعلى البشر لتقديم إجابات أفضل
تسريع خوارزمية بنسبة 30%
توصّل الخبراء أيضاً إلى طريقة لتسريع خوارزمية بالغة الأهمية تُستخدم في التشفير بنسبة 30%. تعد هذه الخوارزميات من أكثر الركائز شيوعاً في مجال البرمجيات. ويمكن أن تُحدث التسريعات الطفيفة فرقاً هائلاً؛ إذ إنها تخفض التكاليف وتوفّر الطاقة.
يقول عالم الأبحاث في شركة جوجل ديب مايند، دانيال مانكويتز: "لم يعد قانون مور قابلاً للتطبيق، وهو القانون الذي ينص على أن الرقائق الإلكترونية تقترب من حدود إمكانياتها الفيزيائية الأساسية. يجب علينا التوصل إلى طرق جديدة ومبتكرة لتحسين الحوسبة".
يقول الباحث الذي يدرس تصميم الخوارزميات الفعالة وتنفيذها في معهد كارلسروه للتكنولوجيا في ألمانيا، بيتر ساندرز، الذي لم يشارك في الاكتشافات الجديدة: "إنه نهج جديد مثير للاهتمام، ولا يزال الترتيب أحد أكثر الإجراءات الفرعية استخداماً في الحوسبة".
خوارزميات ألفا ديف
نشرت شركة ديب مايند النتائج الجديدة بتاريخ 7 يونيو/ حزيران 2023 في مجلة نيتشر (Nature). لكن الملايين من مطوري البرامج يستخدمون التقنيات التي اكتشفها برنامج ألفا ديف بالفعل. قدمت ديب مايند في يناير/ كانون الثاني 2022 خوارزميات الترتيب الجديدة إلى المنظمة التي تدير لغة سي++، وهي إحدى لغات البرمجة الأكثر شيوعاً في العالم. وأضيفت الخوارزميات التي اكتشفها ألفا ديف إلى اللغة بعد شهرين من التدقيق المستقل الصارم. تمثّل إضافة هذه الخوارزميات أول تغيير يجرى على خوارزميات الترتيب الخاصة بلغة سي++ منذ أكثر من عقد من الزمن، وهي أول تحديث يتضمن خوارزمية اكتشفها الذكاء الاصطناعي على الإطلاق.
أضافت ديب مايند خوارزمياتها الجديدة الأخرى إلى مجموعة أبسيل (Abseil)، وهي مجموعة مفتوحة المصدر من خوارزميات لغة سي++ المكتوبة مسبقاً والتي يمكن أن يستخدمها أي شخص يكتب الرموز البرمجية باستخدام هذه اللغة. تحسب خوارزميات التشفير هذه أرقاماً تحمل اسم أرقام التجزئة، يمكن استخدامها على أنها معرّفات فريدة لأي نوع من البيانات. تقدّر ديب مايند أن خوارزمياتها الجديدة تُستخدم الآن تريليونات المرات يومياً.
صُمم برنامج ألفا ديف بناءً على برنامج ألفا زيرو، وهو نموذج التعلّم المعزز الذي درّبته شركة ديب مايند على ممارسة ألعاب مثل غو (Go) والشطرنج. تَمثل إنجاز ديب مايند غير المسبوق في معالجة مشكلة اكتشاف خوارزمية أسرع على أنها لعبة، ثم جعل نموذج الذكاء الاصطناعي الذي طوّرته يربحها، وهي الطريقة نفسها التي استخدمتها الشركة لتسريع العمليات الحسابية في البحث الذي نُشر في 2022.
اقرأ أيضاً: باحثو «ديب مايند» يطورون نموذج ذكاء اصطناعي يحاكي تفكير الأطفال
كيف دربت ديب مايند البرنامج؟
في حالة برنامج ألفا ديف، تتضمن اللعبة اختيار تعليمات الكمبيوتر وترتيبها بطريقة تجعل أسطر الرموز البرمجية الناتجة تشكّل خوارزمية. يربح البرنامج اللعبة إذا كانت الخوارزمية التي ولّدها صحيحة وأسرع من الخوارزميات المستخدمة مسبقاً. تبدو هذه اللعبة بسيطة، ولكن يتعين على البرنامج البحث عبر عدد هائل من الترتيبات الممكنة حتى يلعبها على النحو الصحيح.
اختارت ديب مايند استخدام لغة التجميع، وهي لغة برمجة يمكن استخدامها لتوفير تعليمات محددة حول كيفية نقل الأرقام عبر الرقائق الإلكترونية في الكمبيوتر. لا يستخدم الكثير من المبرمجين لغة التجميع، وهي اللغة التي تُترجم إليها الرموز البرمجية المكتوبة بلغات مثل سي++ قبل تشغيلها. تتمثل ميزة هذه اللغة في أنها تتيح تقسيم الخوارزميات إلى خطوات بسيطة، وهي نقطة انطلاق ملائمة في حال البحث عن طرق مختصرة.
تحتوي رقائق الكمبيوتر على فتحات مختلفة حيث توضع الأرقام وتُعالج. تتضمن لغة التجميع تعليمات أساسية للتلاعب بمحتوى هذه الفتحات، مثل تعليمة (mov(A,B)) التي تجعل الحاسوب ينقل الرقم الموجود في الفتحة (A) إلى الفتحة (B)، وتعليمة (cmp(A,B)) التي تجعل الكمبيوتر يتحقق ما إذا كان محتوى الفتحة (A) أصغر من محتوى الفتحة (B) أو أكبر منه أو يساويه. يمكن للسلاسل الطويلة من هذه التعليمات تنفيذ جميع المهام التي تستطيع أجهزة الكمبيوتر تنفيذها.
اقرأ أيضاً: ما هي أهم ميزة أغفلها الضجيج الإعلامي بشأن نموذج الذكاء الاصطناعي الجديد من ديب مايند؟
تصميم خوارزميات قابلة للتشغيل
يُجري برنامج ألفا ديف حركة في اللعبة من خلال إضافة تعليمة في لغة التجميع إلى الخوارزمية التي يصممها. يضيف البرنامج أولاً التعليمات عشوائياً، ما يولّد الخوارزميات غير القابلة للتشغيل. بمرور الوقت، تعلّم البرنامج إجراء الحركات التي تربحه اللعبة، تماماً كما فعل برنامج ألفا زيرو في الألعاب اللوحية. أضاف هذا البرنامج التعليمات التي أدت إلى تصميم خوارزميات قابلة للتشغيل وصحيحة وسريعة.
ركّزت شركة ديب مايند على تطوير خوارزميات ترتيب القوائم القصيرة التي تحتوي على 3-5 عناصر. تُستخدم هذه الخوارزميات على نحو متكرر في البرامج التي ترتّب القوائم الأطول. ولذلك، سيكون لتسريع هذه الخوارزميات القصيرة تأثير تراكميّ غير مباشر.
درس الباحثون الخوارزميات القصيرة وحسّنوها لعقود من الزمن. بدأ مانكويتز وزملاؤه بتطوير خوارزمية لترتيب القوائم الثلاثية العناصر لإثبات المفهوم فقط. تتضمن أفضل نسخة ابتكرها المطورون البشر من هذه الخوارزمية 18 تعليمة. ولم يعتقد مانكويتز وزملاؤه أنهم سيتمكنون من تحسينها؛ إذ يقول مانكويتز: "في الواقع، لم نتوقع أن نتمكن من التوصل إلى خوارزمية أفضل. ولكن ما فاجأنا هو أننا تمكّنا من جعل هذه الخوارزمية أسرع. اعتقدنا في البداية أن النتائج التي توصلنا إليها كانت خاطئة أو ناجمة عن خلل ما أو شيء من هذا القبيل، ولكن عندما حللنا البرنامج أدركنا أن ألفا ديف قد اكتشف شيئاً ما بالفعل".
توصّل هذا البرنامج إلى طريقة لترتيب قائمة من 3 عناصر في 17 تعليمة بدلاً من 18. وما اكتشفه هو أنه بالإمكان اختصار بعض الخطوات. يقول مانكويتز: "عندما نظرنا إلى النتائج لاحقاً، أدركنا أنها منطقية بالتأكيد. ولكن اكتشاف هذه الخوارزمية [من دون برنامج ألفا ديف] يتطلّب الخبراء في لغة التجميع".
لم يستطع ألفا ديف التغلّب على أفضل نسخة بشرية من خوارزمية ترتيب قائمة رباعية العناصر، والتي تحتوي على 28 تعليمة. لكنه تغلّب على أفضل نسخة بشرية للقوائم الخماسية العناصر، وقلّل عدد التعليمات من 46 إلى 42 تعليمة.
اقرأ أيضاً: هل تحقق شركة ديب مايند الأهداف الطبية التي أنشئت لأجلها؟
كيف يؤدي ذلك إلى تسريع الخوارزميات؟
يؤدي ذلك إلى تسريع الخوارزميات كثيراً. استغرقت الخوارزمية بلغة سي++ المستخدمة حالياً لترتيب قائمة خماسية العناصر نحو 6.91 نانو ثانية على رقاقة سكاي ليك (Skylake) من شركة إنتل. بينما استغرقت الخوارزمية التي طوّرها ألفا ديف 2.01 نانو ثانية، أي إنها كانت أسرع بنسبة 70%.
تقارن شركة ديب مايند الاكتشاف الذي أجراه ألفا ديف بواحدة من حركات برنامج ألفا غو الغريبة (AlphaGo)، والتي أدت إلى الربح في مباراة في لعبة غو ضد الأستاذ الكبير لي سيدول (Lee Sedol) في عام 2016. يقول مانكويتز: "ظن الخبراء جميعهم أن هذه الحركة ليست الخيار الصحيح، وأنها حركة سيئة. ولكن في الواقع، كانت هذه هي الخطوة الصحيحة، وربح برنامج ألفا غو اللعبة وأثّر في الاستراتيجيات التي يتّبعها لاعبو غو المحترفون".
أُعجب ساندرز بالمكتشفات الجديدة، ولكنه يعتقد أنه يجب عدم المبالغة في أهميتها؛ إذ يقول: "لا أنكر أن تقنيات التعلم الآلي تصبح أكثر قدرة على تغيير قواعد اللعبة في البرمجة بمرور الزمن، ويتوقع الجميع أن الذكاء الاصطناعي سيكون قادراً على ابتكار خوارزميات جديدة أكفأ قريباً. ولكننا لم نصل إلى تلك المرحلة بعد".
من إحدى النواحي، يشير ساندرز إلى أن برنامج ألفا ديف يستخدم فقط مجموعة فرعية من التعليمات المتوفرة في لغة التجميع. ويقول إن العديد من الخوارزميات المتوفرة حالياً يستخدم تعليمات لم يجرّب البرنامج استخدامها. يجعل ذلك مقارنة ألفا ديف بالنهُج المنافسة الأفضل أصعب.
لا شك في أن برنامج ألفا ديف له حدوده؛ إذ تحتوي أطول خوارزمية صممها على 130 تعليمة فقط، وهي ترتب قائمة يصل عدد عناصرها إلى 5 عناصر. انتقى البرنامج في كل خطوة تعليمة في لغة التجميع من 297 تعليمة محتملة (من عدد أكبر بكثير من التعليمات). يقول مانكويتز: "أصبحت عملية التعلّم بطيئة بعد 297 تعليمة وفي خوارزميات التجميع التي يتجاوز طولها 130 تعليمة".
يعود ذلك إلى أنه من أجل 297 تعليمة (أو حركة في اللعبة)، فإن عدد الخوارزميات المحتملة التي يمكن أن ينشئها ألفا ديف يتجاوز العدد الأقصى للحركات في الشطرنج (12010 حركة) وعدد الذرات في الكون (نحو 8010 ذرة).
اقرأ أيضاً: نظام ذكاء اصطناعي من ديب مايند يستطيع التحكم بالبلازما فائقة السخونة داخل مفاعل اندماجي
الاتجاه لتطوير الخوارزميات الأطول
يخطط الفريق لتعديل برنامج ألفا ديف بطريقة تتيح له العمل باستخدام التعليمات في لغة سي++ بدلاً من لغة التجميع لتطوير الخوارزميات الأطول. من دون القدرة على التحكم الدقيق، قد يفوّت ألفا ديف بعض الاختصارات، ولكن النهج سيكون قابلاً للتطبيق على مجموعة متنوعة من الخوارزميات.
يتمنّى ساندرز أيضاً أن تصدر مقارنة أشمل مع أفضل النُهج التي ابتكرها المطورون البشر، خاصة بالنسبة للخوارزميات الأطول. تقول شركة ديب مايند إن هذا جزء من خطتها. يريد مانكويتز دمج برنامج ألفا ديف مع أفضل النهج التي ابتكرها المطورون البشر، ما سيساعده على الاستفادة من الحدس البشري بدلاً من البدء من الصفر.
في النهاية، يمكن التوصل إلى طرق أسرع. يقول مانكويتز: "يتطلب توصل البشر إلى طرق أسرع خبرة واسعة وزمناً طويلاً، ربما يصل إلى أيام أو أسابيع، وذلك لتحليل هذه البرامج واكتشاف التحسينات. لذلك، لم يقدم أحد على ذلك من قبل".