ماذا تعني البيانات المشوشة؟
هي بيانات تحتوي على كمية كبيرة من المعلومات الإضافية التي لا معنى لها. حيث لا يستطيع نظام المستخدم فهمها وتفسيرها بشكل صحيح. يمكن أن تؤثر البيانات المشوشة سلباً على نتائج أي تحليل للبيانات وتحريف الاستنتاجات إذا لم يتم التعامل معها بشكل صحيح. ويستخدم التحليل الإحصائي لإزالة التشويش من البيانات.
ما هو سبب ظهور البيانات المشوشة؟
غالباً ما تكون الضوضاء العشوائية سبباً أساسياً للبيانات المشوشة. حيث إن الضوضاء العشوائية مشكلة لا مفر منها. إنها تؤثر على عمليات جمع البيانات وإعدادها، حيث تحدث الأخطاء بشكل كبير. الضوضاء مصدران رئيسيان:
- الأخطاء التي أدخلتها أدوات القياس.
- إدخال أخطاء عشوائية عن طريق المعالجة الخاطئة عند جمع البيانات.
معالجة البيانات المشوشة
- تقنية فرز البيانات: يتم فرز البيانات، ثم فصل القيم التي تم فرزها وتخزينها في شكل مكدسات متجانسة.
- تحليل الانحدار الخطي: يساعد استخدام الانحدار لإيجاد معادلة رياضية لتلائم البيانات على تخفيف الضوضاء.
- التجميع: يستخدم للعثور على القيم البيانات المشوشة أثناء تجميع البيانات.
- التحليل الخارجي: حيث يتم تنظيم البيانات الصحيحة والمتقاربة في نفس المجموعة. وبالتالي، فإن القيم التي تقع بعيداً عن الكتلة يمكن اعتبارها بيانات مشوشة أو قيم متطرفة.