ابتداءً ببرمجيات الفدية ووصولاً إلى شبكات البوتات (شبكات الروبوتات البرمجية)، يبدو أنّ البرمجيات الخبيثة تأخذ أشكالاً لا حصر لها، وأنها ستتكاثر إلى الأبد. ومع أن المدافعين عن حواسيبنا يبذلون قصارى جهدهم، إلا أنهم بدأوا يفقدون السيطرة، ولهذا فقد قرروا اللجوء إلى الذكاء الاصطناعي للحصول على المساعدة.
هنالك مشكلة واحدة فقط، وهي أن أدوات التعلم الآلي تحتاج إلى الكثير من البيانات. لا بأس بهذا بالنسبة للرؤية الحاسوبية أو معالجة اللغات الطبيعية، حيث تتوفر مجموعات ضخمة من البيانات مفتوحة المصدر لتعليم الخوارزميات كيف تبدو القطة مثلاً، أو كيف ترتبط الكلمات مع بعضها البعض. أما في عالم البرمجيات الخبيثة، فلم يكن شيء كهذا موجوداً، حتى الآن.
في الأسبوع الثالث من شهر أبريل الماضي، أصدرت شركة إيندجيم (Endgame) للأمن السيبراني مجموعة ضخمة من البيانات مفتوحة المصدر المسمّاة إمبير EMBER وهي اختصار باللغة الإنجليزية للعبارة (معيار شركة إندجيم للبرمجيات الخبيثة للأغراض البحثية) (Endgame Malware Benchmark for Research). إنّ إمبير عبارة عن مجموعة من أكثر من مليون تمثيل لملفات خبيثة وغير خبيثة قابلة للتنفيذ ومحمولة في نظام ويندوز، وهي صيغة تختبئ فيها البرمجيات الخبيثة عادةً. قام أيضاً فريق في الشركة بإصدار برنامج ذكاء اصطناعي يمكن تدريبه على مجموعة البيانات. الفكرة هي أنه إذا أصبح الذكاء الاصطناعي سلاحاً فعالاً في مكافحة البرامج الخبيثة، فيجب أن يعرف ما الذي يبحث عنه.
تمتلك الشركات الأمنية بحراً من البيانات المحتملة لتدريب خوارزمياتها عليها، ولكن يعدُّ هذا الأمر نعمة ونقمة في الوقت نفسه، إذ تقوم الجهات السيئة التي تصنع البرمجيات الخبيثة بإدخال تعديلات على شيفراتها باستمرار في محاولة للتغلب على عمليات الكشف بشكلٍ مسبق، بالتالي فإن التدريب على عينات البرمجيات الخبيثة التي عفا عليها الزمن قد يثبت أن عملية التدريب هذه عديمة الجدوى.
يقول تشارلز نيكولاس، أستاذ علوم الحاسوب بجامعة ميريلاند في مقاطعة بالتيمور: "إنها لعبة التغلب على الخلد" (وهي لعبة يستخدم فيها اللاعبون المطرقة لإجبار الخلد على العودة إلى حفرته بطرقه على رأسه).
تهدف إمبير إلى مساعدة برمجيات الأمن السيبراني الآلية على المواكبة والتطور. بدلاً من مجموعة من الملفات الحقيقية، والتي يمكن أن تصيب حاسوب أي باحث يستخدمها، فإنّ إمبير تحتوي على شكل تمثيلي لكل ملف، وهو تعبير رقمي يعطي الخوارزمية فكرة عن الخصائص المرتبطة بالملفات الحميدة أو الخبيثة دون تعريضها للملفات الأصلية.
من شأن ذلك أن يساعد أولئك الموجودين في مجتمع الأمن السيبراني على تدريب واختبار المزيد من الخوارزميات بسرعة، ممّا يمكّنهم من بناء ذكاء اصطناعي يصيد البرمجيات الخبيثة بقدرة تكيفية أعلى و بشكلٍ أفضل.
بالطبع، فإنّ جَعْلَ مجموعة البيانات مفتوحة لأي شخص يمكن أن يضعنا أمام مسؤولية أخرى في حال وقوعها في الأيدي الخطأ، حيث يمكن لصانعي البرمجيات الخبيثة استخدام البيانات لتصميم الأنظمة التي لا يستطيع الذكاء الاصطناعي التعرّف عليها، وتلك المشكلة تحدّث عنها هيروم أندرسون المدير الفني لعلوم البيانات في إندجيم، حيث قال أنّ الشركة فكّرت بها منذ البداية. يضيف أندرسون، الذي عمل على إمبير، أنّه يأمل في أن تفوق فوائد هذا الانفتاح مخاطره. علاوةً على ذلك، فإنّ الجريمة السيبرانية مربحة للغاية لدرجة أن الأشخاص الذين يقفون وراء البرمجيات الخبيثة لديهم دوافع جيدة لتنقيح أدواتهم الهجومية بشكل مستمر.
يقول جيرالد فريدلاند، أستاذ علوم الحاسوب بجامعة كاليفورنيا في بيركلي: "على أي حال، سيعثر القراصنة على معلومات مشابهة بطريقة أو بأخرى".