نموذج حقيبة الكلمات BAG OF WORDS MODEL (BOW)

1 دقيقة

ما هو نموذج حقيبة الكلمات؟

عبارة عن تمثيل مخفّض ومبسط لمستند نصي ما أو جزء مختار من نص اعتماداً على معايير محددة مثل تردد الكلمات، وهو مُستخدم في تطبيقات معالجة اللغات الطبيعية واسترجاع المعلومات. يحول نموذج حقيبة الكلمات النصوص العشوائية إلى أشعة ذات طول ثابت عن طريق حساب عدد تكرارات كل كلمة. حيث يتألف الشعاع من مجموعة من الأرقام المعبرة عن تلك التكرارات.

يتجاهل نموذج حقيبة الكلمات القواعد وترتيب الكلمات والعلاقات الدلالية بينها ويركز على عدد تكرارات كل كلمة فقط. حيث يتم تمثيل الجملة أو المستند الذي يعتبر حقيبة عن طريق الكلمات الموجودة فيه. وبذلك يمكن تحديد النقاط التي يركز عليها ذلك المستند. يعتبر هذا النموذج واحداً من أهم طرق استخراج الميزات من النصوص. ويستخدم بشكل شائع في تصنيف النصوص حيث يعتبر تردد كل كلمة الميزة التي تُستخدم لتدريب المصنف. كما يمكن استخدامه في بعض تطبيقات الرؤية الحاسوبية.

المحتوى محمي