باحثون في جامعة الشارقة يطورون نظام ذكاء اصطناعي لتشكيل النصوص العربية وتيسير قراءتها

3 دقيقة
باحثون في جامعة الشارقة يطورون نظام ذكاء اصطناعي لتشكيل النصوص العربية وتيسير قراءتها
حقوق الصورة: shutterstock.com/Artgallery78

يُعدّ التشكيل عنصراً أساسياً في اللغة العربية لفهم المعاني وضبط النطق، حيث تساعد هذه العلامات القارئ على التمييز بين الكلمات التي قد تتشابه في كتابتها ولكن تختلف في معانيها. يؤدي التشكيل دوراً رئيسياً كذلك في الحفاظ على التراث اللغوي والأدبي العربي، إذ يُمكّن الناطقين بغير العربية ومتعلميها من نطق الكلمات بشكل سليم. في الكتابة الحديثة، يقل استخدام التشكيل في النصوص العامة، لكنه يبقى ضرورياً في بعض المجالات التي تتطلب دقة عالية مثل الشعر والنصوص القانونية والدينية. ومع ذلك، فإن إضافة التشكيل إلى النصوص العربية عملية مرهقة في الكثير من الأحيان وتستغرق وقتاً طويلاً، كما أنها عرضة للأخطاء. لذلك، طوّر علماء من جامعة الشارقة نظاماً مؤتمتاً جديداً يمكنه إضافة علامات التشكيل إلى النصوص العربية الرقمية بالاعتماد على الذكاء الاصطناعي، ما يتيح للمتعلمين والمتحدثين بالعربية قراءتها بسهولة ودقة.

"سكون": نظام ذكاء اصطناعي لتشكيل النصوص تلقائياً

في المصطلحات اللغوية، يُطلق على هذه العلامات اسم "الحركات" أو "التشكيل"، وهي ضرورية لفهم النطق الصحيح للكلمات. ومع ذلك، فإن إضافة التشكيل يدوياً تُعد عملية شاقة لا يتقنها سوى اللغويون المتخصصون، كما أن غيابها عن النصوص الرقمية يشكل تحدياً حتى بالنسبة إلى المتحدثين الأصليين باللغة العربية.

لمواجهة هذه المشكلة، طوَّر كلٌّ من الأستاذ الدكتور أشرف النجار والباحثة ربى خرسا من قسم علوم الحاسوب بجامعة الشارقة، والأستاذ الدكتور حسين ياغي من قسم اللغات الأجنبية بالجامعة، نظاماً يُسمى سكون (SUKOUN)، وهو اسم يشير إلى علامة التشكيل التي توضع فوق الحرف للدلالة على عدم تحركه أثناء الكلام. يمكن لهذا النظام تزويد جميع أنواع النصوص الرقمية بالتشكيل الصحيح تلقائياً.

وعرض الباحثون تفاصيل نظامهم في دراسة منشورة في دورية (Expert Systems with Applications)، حيث وصفوه بأنه "نهج حديث" يمكنه تحسين دقة النصوص العربية ونطقها.

اقرأ أيضاً: باحثون من جامعة الشارقة يطوّرون نماذج ذكاء اصطناعي لإدراج اللغة العربية ولهجاتها في معالجة اللغات الطبيعية

"سكون" يتفوق على أدوات التشكيل التلقائي الحالية

يقول الباحثون في دراستهم إن "سكون" يوفر نصوصاً مشكّلة في الوقت الفعلي عبر موقع ويب سهل الاستخدام، موضحين أن مقارنة هذا النظام الجديد بأدوات التشكيل التلقائي الأخرى المتاحة حالياً تُظهر تفوق "سكون" من حيث دقة التنبؤ بالتشكيل والمحافظة على تنسيق نصوص الإدخال الأصلية.

يصف الدكتور أشرف النجار أداء "سكون" بأنه "ثوري"، موضحاً أن النظام حقق معدل خطأ في التشكيل (DER) منخفضاً يصل إلى 1.14%، ومعدل خطأ في الكلمات (WER) لا يتجاوز 3.34% عند اختباره على قاعدة بيانات التشكيل العربي (Arabic Diacritization (AD. كما سجل معدل خطأ في التشكيل بلغ 1.11% عند اختباره على قاعدة بيانات (Tashkeela Processed (TP، وهو ما يمثل انخفاضاً في معدلات الخطأ بنسبة تزيد عن 30% مقارنة بأفضل الأنظمة السابقة.

ويرى الدكتور النجار أن ما يميز هذا النظام ليس دقته العالية فقط، وإنما أيضاً كفاءته وسهولة استخدامه، إذ يتطلب قدرة حوسبية أقل للتدريب والتشغيل بفضل الابتكارات في مجالات معالجة البيانات ونقل التعلم. كما أنه يعمل في الوقت الفعلي، ما يسمح لأي شخص بإدخال نصوص عربية غير مشكّلة والحصول فوراً على نسخة مشكّلة بالكامل عبر واجهة الويب سهلة الاستخدام.

تطبيقات واسعة للنظام الجديد في التعليم والثقافة العربية

يعزو العلماء نجاح "سكون" إلى قدرته على جسر الهوة بين التعقيد اللغوي للغة العربية، خصوصاً في علم الصرف، والإمكانات التقنية للتعلم الآلي.

يتمتع النظام بإمكانات يمكن أن تُحدث تحولاً كبيراً في العديد من التطبيقات، مثل التعليم والترجمة وغيرهما. ويقول الدكتور النجار إن "سكون" قادر على مساعدة الطلاب على قراءة اللغة العربية وتعلمها على نحو أكثر كفاءة، ودعم ضعاف البصر من خلال تحسين أنظمة تحويل النصوص إلى كلام، فضلاً عن تعزيز خدمات الترجمة وغيرها من أدوات معالجة اللغات الطبيعية.

إلى جانب هذه الإمكانات، يمكن للنظام أن يسهم في دعم الأبحاث اللغوية العربية من خلال توفير تشكيل دقيق للنصوص، ما يُمكن الباحثين من تحليلها على نطاق واسع. كما يساعد على الحفاظ على التراث الثقافي العربي من خلال إتاحة النصوص الكلاسيكية والتاريخية للأجيال القادمة.

اقرأ أيضاً: كيف واجه تطبيق صوتِك لتحويل الكلام الصوتي إلى نص منسَّق تحديات اللغة العربية؟

أكثر من مجرد أداة ذكاء اصطناعي

يرى الباحثون أن "سكون" ليس مجرد أداة ذكاء اصطناعي، وإنما تطبيق عملي وسهل الاستخدام. وتشير المؤلفة الرئيسية للدراسة، ربى خرسا، إلى أن نشر النظام على نطاق واسع يمكن أن يُغير منظور تعلم اللغة العربية وتعليمها. وتضيف: "يتمتع سكون بالقدرة على إحداث ثورة في تعليم اللغة العربية، حيث يمكن للمعلمين والطلاب استخدامه لتشكيل النصوص بسهولة، ما يساعد في تعلم القواعد النحوية الصحيحة والنطق السليم وفهم المعاني بدقة. ويمثل هذا الأمر أهمية خاصة للمتعلمين غير الناطقين بالعربية، وكذلك للأطفال الذين يطورون مهاراتهم اللغوية".

وتؤكد خرسا أن "سكون" يُعد مثالاً على كيفية توظيف الذكاء الاصطناعي المتقدم، خصوصاً النماذج المستندة إلى تمثيلات أداة الترميز ثنائية الاتجاه من المحولات، والمعروفة اختصاراً باسم بيرت (BERT)، لحل المشكلات اللغوية المعقدة بكفاءة، مضيفة أن نجاح النظام يبرز دور الذكاء الاصطناعي في معالجة وتعزيز اللغات غير الممثلة تمثيلاً كافياً، ويفتح الباب أمام تطورات مماثلة في مجالات أخرى.

من جانبه، يوضح المؤلف المشارك في الدراسة الدكتور حسين ياغي، أن هذا النظام "ليس مجرد أداة تشكيل، بل هو بوابة لتحسين التعليم والحفاظ على الثقافة في العالم العربي". كما أن "سكون"، الناتج عن التعاون بين قسمي علوم الحاسوب واللغات الأجنبية في جامعة الشارقة، يعكس الابتكار متعدد التخصصات والالتزام بالتميز الأكاديمي في الجامعة.

وعلى الرغم من أن قطاع التكنولوجيا لم يتبنَّ بعد نظام التشكيل المؤتمت الجديد، يتوقع الدكتور النجار أن يكون له تطبيقات عملية مهمة في مجالات التعليم وإتاحة المحتوى العربي، من خلال توفير نصوص دقيقة التشكيل، ما يساعد الطلاب والمعلمين على تحسين النطق والقواعد والفهم اللغوي.

المحتوى محمي