ما هو خطأ التعميم؟
هو الفرق بين أداء نموذج التعلم الآلي على بيانات التدريب وأدائه على بيانات جديدة وغير معروفة مسبقاً بالنسبة له، ويعد مقياساً لجودة نماذج الذكاء الاصطناعي. ويشير خطأ التعميم المنخفض إلى أن النموذج قد تعلم التعميم بشكل جيد، بينما يشير خطأ التعميم العالي إلى أن النموذج يفرط في التعلم من بيانات التدريب ولا يعمم بشكل جيد.
التعميم في التعلم الآلي
من أجل التعميم بشكلٍ جيد، لنفرض أن لدينا قاعدة بيانات تحتوي على أنواع الأشجار مثل السرو والصنوبر والأرز وقد تم تصنيفها من فئة الأشجار، وقام المستخدم بإدخال صورة شجرة غير موجودة في قاعدة البيانات، ولنفرض شجرة المانجو لاختبار تصنيفها، هل يستطيع النموذج فهم أنها من الأشجار بناء على الخصائص المتشابهة مع تصنيف الأشجار أم لا؟
توجد حالتان للإجابة:
- خطأ التعميم المنخفض: يستطيع النموذج التنبؤ بأنها تنتمي لتصنيف الأشجار.
- التعميم المرتفع: لا يستطيع النموذج التنبؤ بأنها من تصنيف الأشجار لأنه قام بالإفراط بمواءمة بيانات التدريب، ما يقوده للخطأ في التنبؤ بتصنيف بيانات الاختبار.
كيفية تقليل خطأ التعميم
يمكن التقليل من خطأ التعميم باتباع بعض الإجراءات، ومن أهمها:
- زيادة حجم البيانات التدريبية: يزيد حجم البيانات التدريبية من دقة نموذج التعلم الآلي ويقلل خطأ التعميم.
- تقليل تعقيد النموذج: قد تكون الأخطاء المرتبطة بالتعميم مرتبطة بزيادة تعقيد النموذج. يمكن تخفيف تعقيد النموذج عن طريق استخدام نماذج أبسط أو استخدام خوارزميات تحديد الخصائص (feature selection) لاختيار الخصائص الأكثر أهمية للتنبؤ.
- استخدام تقنيات التحقق: تساعد تقنيات التحقق على تقييم أداء النموذج على بيانات جديدة وفق معايير تحقق محددة.
- اختيار المعاملات: يعد اختيار المعاملات الفائقة والخيارات الإعدادية للنموذج (hyperparameters) طريقة لتقليل خطأ التعميم، ويمكن تجربة مجموعة من المعاملات للحصول على أداء أفضل على البيانات جديدة.