ما هو تخفيض الأبعاد؟
هو تقنية إحصائية في التعلم الآلي لتقليل كمية المتغيرات العشوائية في المشكلة من خلال الحصول على مجموعة من المتغيرات الرئيسية. يمكن تنفيذ هذه العملية باستخدام عدة طرق تبسط نمذجة المشكلات المعقدة، وتزيل التكرار وتقلل من الإفراط في المواءمة وبالتالي تقليل تضمين النتائج التي لا تنتمي لمجموعة النتائج الصحيحة.
طرق تخفيض الأبعاد
هناك طريقتان لتطبيق تقنية تخفيض الأبعاد، وهما:
- اختيار الميزات: هو عملية اختيار المجموعة الفرعية من الميزات ذات الصلة واستبعاد الميزات غير ذات الصلة الموجودة في مجموعة البيانات لبناء نموذج عالي الدقة.
- استخراج الميزات: هو عملية تحويل الفضاء الذي يحتوي على العديد من الأبعاد إلى مساحة ذات أبعاد أقل، ويفيد عندما نريد الاحتفاظ بالمعلومات كاملةً مع استخدام موارد أقل أثناء معالجة المعلومات.
مزايا تخفيض الأبعاد
إليك بعض مزايا تطبيق تقنية الحد من الأبعاد على مجموعة البيانات:
- تقليل المساحة المطلوبة لتخزين مجموعة البيانات.
- وقت أقل للتدريب بعد تخفيض أبعاد الميزات.
- الأبعاد المنخفضة تساعد على تمثيل البيانات بسهولة.
- إزالة الميزات الزائدة عن الحاجة إذا كانت موجودة من خلال المؤشرات الخطية المتعددة.
عيوب تخفيض الأبعاد
إلى جانب المزايا توجد عدة تحديات، تعرّف عليها:
- قد يؤدي إلى فقدان جزء من البيانات.
- يفشل تحليل المكونات الرئيسية في الحالات التي لا يكون فيها المتوسط والتباين كافيين لتحديد مجموعات البيانات.
- قد يكون من الصعب فهم العلاقة بين السمات الأصلية والأبعاد المختزلة.
- قد يؤدي تخفيض الأبعاد إلى الإفراط في المواءمة خاصة عندما يتم اختيار عدد المكونات بناء على بيانات التدريب.