ما هي بيانات الاختبار؟
مجموعة بيانات تُستخدم للحصول على تقييم غير منحاز لأداء نموذج التعلم الآلي النهائي بالنسبة للمهمة التي تم تدريبه عليها، وتكون هذه المجموعة منتقاة بعناية لتشمل جميع الحالات الممكنة لتلك المهمة. فعلى سبيل المثال في حال كان المطلوب من النموذج تصنيف الأشياء، فيجب أن تحتوي مجموعة بيانات الاختبار على أمثلة لم يراها ذلك النموذج من قبل تُمثل كافة الأصناف.
يجب أن تكون مجموعة بيانات الاختبار مُستقلة تماماً عن مجموعة بيانات التدريب. وذلك لأن وجود أمثلة مشتركة بين هاتين المجموعتين سيصّعب اكتشاف فيما إذا تعلم النموذج تعميم المعلومات والخبرات التي اكتسبها من مجموعة التدريب، أم أنه قام بحفظها وتذكرها فقط. وعلى الرغم من تشابه بيانات الاختبار مع بيانات التحقق من حيث الفكرة، إلا أن هناك اختلاف بينهما. فالأولى تستخدم بعد نهاية تدريب النموذج لتقييم أدائه. أما الثانية فتُستخدم أثناء مرحلة التدريب لضبط المعاملات الأساسية وأمثلة أداء ذلك النموذج.