ما هو التعلم الآلي التنافسي؟

عبارة عن تقنية تُستخدم في التعلم الآلي لخداع أو تضليل النماذج بالاعتماد على مدخلات خبيثة تُعرف باسم الأمثلة التنافسية أو العدائية (Adversarial Examples). يُستخدم التعلم الآلي التنافسي في مجال واسع من التطبيقات، لكن أكثر استخداماته شيوعاً تنفيذ الهجمات الهادفة إلى تخريب وتعطيل أنظمة التعلم الآلي عن العمل. وتكمن خطورة هذه الهجمات في أن نفس الصنف منها يمكن تغييره بسهولة للعمل مع نماذج متعددة ذات بُنى مختلفة ومدربة بمجموعات بيانات مختلفة أيضاً.

ما هي أنواع هجمات التعلم الآلي التنافسي؟

يمكن تقسيم هجمات التعلم الآلي التنافسي إلى نوعين هما مدخلات سوء التصنيف وتسميم البيانات. وتعد مدخلات سوء التصنيف النوع الأكثر شيوعاً؛ حيث يقوم فيها المهاجمون بإخفاء محتوى خبيث في فلاتر خوارزميات التعلم الآلي. ويكون الهدف من ذلك إجبار النظام على تصنيف مجموعة بيانات معينة بشكل خاطئ. أما بالنسبة لتسميم البيانات فيتم فيه إضافة بيانات خاطئة أو غير دقيقة إلى مجموعة البيانات لتخفيض الدقة الإجمالية للخرج.

كيف يتم التصدي لهذه الهجمات؟

يتم التصدي لهجمات التعلم الآلي التنافسي بطريقتين هما:

  • التدريب التنافسي: طريقة تعتمد على التعلم الموجه لتدريب النموذج على اكتشاف الأمثلة التنافسية، وذلك عن طريقته تغذيته بجميع الأمثلة الممكنة بعد وسمها بأنها تهديد.
  • التقطير الدفاعي: طريقة تهدف لجعل خوارزميات التعلم الآلي أكثر مرونةً من خلال تدريب نموذج ما على التنبؤ بخرج نموذج آخر تم تدريبه في وقت سابق؛ مما يساعد على تعزيز الدقة.

المحتوى محمي