الجديد في هذا الموضوع
كشفت دراسة حديثة أجراها باحثون من جامعة أم القرى وجامعة الإمام عبد الرحمن بن فيصل بالمملكة العربية السعودية أن النماذج اللغوية الكبيرة لا تزال تواجه تحديات واضحة في فهم اللهجات السعودية. وركز البحث على كيفية أداء هذه النماذج عند معالجتها لهجات متعددة ضمن السعودية، خاصة في سياقات يومية وثقافية. شملت العينة بيانات لغوية متنوعة من مختلف مناطق المملكة، وجرى اختبار النموذج حول فهم تعابير ولهجات مختلفة وذلك بهدف إنشاء معيار أبشر Absher الذي يقيم فهم النماذج للهجات السعودية.
أهمية البحث
لأن الاستخدام الفعلي للنماذج اللغوية الكبيرة في تطبيقات مثل الدعم التقني أو التعليم يتطلب أن تفهم بدقة اللهجات المحلية، فالاعتماد على نماذج لا تفهم اللهجات يؤدي إلى استجابات غير صحيحة تؤثر في ثقة المستخدمين بهذه التقنية.
أهم النتائج
- أظهر معيار أبشر أن نماذج اللغة الكبيرة الحالية تظهر انخفاضاً كبيراً في الدقة عند التعامل مع اللهجات السعودية مقابل العربية الفصحى.
- ارتبط هذا الانخفاض ارتباطاً وثيقاً بغياب التدريب على بيانات تتضمن لهجات محلية.
- أدى تدريب خاص ببيانات لهجة إلى تحسن ملحوظ في الفهم والتفاعل، حيث ارتفعت نسب الدقة بمقدار 20‑30% مقارنة بالنماذج التقليدية.
التوصيات والتطبيق العملي
- يجب تدريب النماذج باستخدام بيانات تضم لهجات سعودية محلية.
- استخدم معيار أبشر لتقييم النماذج قبل إطلاق أي منتجات ذكاء اصطناعي تخدم السوق السعودية.
- التعاون مع مختصين لغويين لتصميم محتوى تدريب مناسب.
محاذير
توجد في المملكة العربية السعودية عشرات اللهجات، لذا يجب التركيز أولاً على اللهجات الأكثر انتشاراً.
المصدر
Absher: A Benchmark for Evaluating Large Language Models Understanding of Saudi Dialects
مؤشر أبشر لتقييم فهم نماذج الذكاء الاصطناعي للهجات السعودية
Renad Al‑Monef، Hassan Alhuzali، Nora Alturayeif، Ashwag Alasmari
arXiv، يوليو 2025 (cs.CL)