ما هو تجميع البيانات؟
أي عملية تتضمن جمع البيانات الخام من مصادر متعددة والتعبير عنها على شكل ملخص يمكن استخدامه في التحليلات الإحصائية. فعلى سبيل المثال يمكن تجميع البيانات الخام على امتداد فترة زمنية معطاة والتعبير عنها من خلال إحصائيات مثل المتوسط والمجموع والقيم الدنيا والقيم العظمى وغيرها. وبعد إجراء عملية التجميع وتمثيل البيانات إما بشكل مرئي أو كتقرير مكتوب، يمكن تحليل البيانات المجمعة للحصول على رؤى وأفكار جديدة حول الموارد المحددة.
وبشكل عام هناك نوعان لتجميع البيانات:
- التجميع الزمني: يشمل تجميع كافة نقاط البيانات لمورد واحد على امتداد فترة زمنية محددة.
- التجميع المكاني: يشمل تجميع كافة نقاط البيانات لمجموعة من الموارد على امتداد فترة زمنية محددة.
كيف تتم عملية تجميع البيانات؟
تمر عملية تجميع البيانات بالمراحل التالية:
- الجمع: تقوم أدوات التجميع في هذه المرحلة باستخراج البيانات الخام من مصادر متعددة وتخزينها معاً في قاعدة بيانات ضخمة، ومن أهم الأمثلة على مصادر هذه البيانات أجهزة إنترنت الأشياء ومواقع التواصل الاجتماعي والعناوين الإخبارية ومراكز المكالمات وغيرها.
- المعالجة: بعد استخراج البيانات تقوم أدوات التجميع أو كما تعرف باسم مجمعات البيانات (Data Aggregators) بمعالجتها؛ حيث تقوم تلك المجمعات بتحديد البيانات الخام التي سيتم تجميعها. وقد تُطبق عليها خوارزميات التحليل التنبؤي أو التعلم الآلي وغيرها من تقنيات الذكاء الاصطناعي للحصول على رؤى جديدة. وأخيراً يتم تطبيق التوابع الإحصائية الخاصة بعملية التجميع.
- التمثيل: يتم تمثيل البيانات المجمعة في صيغة ملخصات تُقدم بحد ذاتها بيانات جديدة ونتائج إحصائية شاملة وعالية الجودة.
أين يستخدم تجميع البيانات؟
يسمح تجميع البيانات لخبراء التحليل بالوصول إلى كميات ضخمة من البيانات وفحصها ضمن إطار زمني معقول؛ فقد يُمثل سطر واحد من البيانات المجمعة مئات أو آلاف أو أكثر حتى من سجلات البيانات الخام. ويعد ذلك أمراً مفيداً في العديد من المجالات مثل القطاع المالي وقطاعات الأعمال والقرارات الاستراتيجية والتخطيط وتسعير المنتجات والخدمات وأمثلة العمليات وإنشاء استراتيجيات التسويق. تُستخدم البيانات المجمعة أيضاً في مجال التحليل الإحصائي للحصول على معلومات حول مجموعة معينة بناءً على متغيرات ديموغرافية وسلوكية محددة مثل العمر أو المهنة أو الدخل أو المستوى التعليمي.