تعد اللغة العربية واحدة من أقدم اللغات وأغناها ثقافياً، إذ يتحدث بها نحو 422 مليون شخص حول العالم، منهم 313 مليون ناطق أصلي. وهي اللغة الرسمية في نحو 22 دولة متعددة اللهجات. ولكن على الرغم من هذا الانتشار الواسع وعدد المتحدثين الكبير، فإن الحضور الرقمي للغة العربية لا يزال محدوداً، إذ تشير البيانات إلى أن نسبة المحتوى العربي على الإنترنت لا تتجاوز 0.6%. يضاف إلى ذلك تراجع استخدام اللغة العربية بين الأجيال الشابة في مجتمعاتهم نفسها، حيث يقبل الكثير من الشباب على استخدام الإنجليزية كلغة يومية في التعليم والعمل، ما يثير مخاوف بشأن مستقبل العربية في ظل التقدم التقني المعاصر.
ومع ذلك فإن عصر الذكاء الاصطناعي قد يحمل فرصاً واعدة لدعم وازدهار اللغة العربية إذا ما أُحسن استغلالها. وقد تسهم مبادرات مثل "فنار"، وهو نموذج ذكاء اصطناعي توليدي باللغة العربية طوره معهد قطر لبحوث الحوسبة في جامعة حمد بن خليفة، عضو مؤسسة قطر، في حماية اللغة العربية وتعزيز استخدامها في عصر الذكاء الاصطناعي.
اقرأ أيضاً: معهد قطر لبحوث الحوسبة بمؤسسة قطر يتصدى للتهديدات الرقمية للغة العربية
فرص وتحديات أمام اللغة العربية
إحدى أبرز التحديات التي تواجه الدول غير الناطقة بالإنجليزية هي هيمنة هذه اللغة على مجالات التكنولوجيا والبحث العلمي وسوق العمل العالمي. وفي مجال الذكاء الاصطناعي تحديداً، أدى تركز الأبحاث وتطوير معظم النماذج اللغوية على اللغة الإنجليزية إلى إهمال نسبي للغات الأخرى، بما فيها العربية، ما تسبب في نوع من الانحياز نحو المنظور الغربي في مخرجات هذه النماذج وقلل من دقتها في فهم السياقات العربية. وقد وجدت دراسة صدرت العام الماضي عن شركة الذكاء الاصطناعي التونسية "كلاستر لاب" أن العديد من النماذج متعددة اللغات تفشل في استيعاب التعقيد النحوي والأطر الثقافية المرجعية للغة العربية، لا سيما في ظل سياقاتها الغنية باللهجات.
كما يمثل التنوع الداخلي في اللغة العربية تحدياً فريداً. فالعربية الفصحى الحديثة هي اللغة الرسمية المكتوبة، لكن على أرض الواقع تنتشر عشرات اللهجات المتباينة بين الدول والمناطق، وتختلف فيما بينها اختلافاً كبيراً، وهو ما يربك نماذج الذكاء الاصطناعي التي غالباً ما يجرى تدريبها على نصوص باللغة العربية الفصحى.
على الرغم من هذه التحديات، توفر تقنيات الذكاء الاصطناعي فرصاً غير مسبوقة لتجاوز العقبات اللغوية وتعزيز حضور اللغة العربية على المستوى العالمي. وقد شهدت السنوات القليلة الماضية انطلاق عدد من النماذج اللغوية الموجهة خصيصاً لخدمة اللغة العربية، والتي يمكنها فهم أسئلة المستخدمين العرب والرد عليها، وإنتاج نصوص مطولة جيدة الصياغة باللغة العربية.
اقرأ أيضاً: 4 أدوات ذكاء اصطناعي يمكنها تحويل النصوص إلى بودكاست باللغة العربية
فنار: رؤية شاملة لحماية اللغة العربية في عصر الذكاء الاصطناعي
يعمل الخبراء في مؤسسة قطر على مشاريع تهدف إلى دمج الابتكار التقني مع الاهتمام بالتراث الثقافي والتاريخي، وذلك من خلال استخدام تقنيات متقدمة مثل التعلم الآلي ومعالجة اللغات الطبيعية، وتطوير أدوات وبرمجيات تمكن من رصد وتوثيق التراث بطريقة فعالة وشاملة، ما يسهم في حمايته ونقله للأجيال القادمة بأفضل صورة ممكنة.
يعد مشروع "فنار" الذي تقوده مؤسسة قطر إحدى أبرز المبادرات الهادفة إلى حماية اللغة العربية في عصر الذكاء الاصطناعي. ويقول الدكتور محمد الطباخ، وهو عالم رئيسي في معهد قطر لبحوث الحوسبة، إن "مشروع فنار ليس مجرد مبادرة لغوية، بل رؤية شاملة نحو مستقبل رقمي عربي مستقل، يعكس ثقافتنا ويحمي لغتنا، ويمنحنا القدرة على المساهمة في تشكيل التكنولوجيا، لا أن نكون ضحايا لتحيزاتها".
ويشير الطباخ إلى "السيادة الرقمية" باعتبارها أحد أهداف هذا المشروع، موضحاً أن "الاعتماد الكامل على التكنولوجيا الغربية يجعلنا مجرد مستهلكين. أما مشروع فنار، فيظهر أن لدينا القدرة على أن نكون صانعين لهذه التكنولوجيا، وأن نمتلك أدواتها. فالملكية هنا ليست تقنية فقط، بل تمس السيادة على المعرفة والمحتوى والاتصال".
وبحسب الموقع الرسمي للمشروع، يعتمد فنار على بنية لغوية قوية وخوارزميات متطورة، ما يتيح له التميز في التفكير بالعربية وفهم المعاني الدقيقة واستيعاب الفروق اللغوية بشكل عميق. وتمنحه هذه المزايا ميزة كبيرة في تعزيز التواصل الفعال عبر الحواجز اللغوية والثقافية وتشجيع تبادل المعرفة.
ويمتاز فنار بمجموعة واسعة من الإمكانيات، تشمل توليد النصوص وإنتاج بيانات الوسائط المتعددة وصناعة المحتوى والترجمة والتدقيق. كما يتمتع بفهم عميق للقيم الثقافية العربية والإسلامية، ويجيد التحدث بمجموعة متنوعة من اللهجات العربية، بالإضافة إلى ميزة التواصل الصوتي التي تتيح إمكانية إجراء حوار طبيعي وسلس.
ويشير مطورو النموذج إلى أن فنار يبحث في مصادر المعلومات ويوفر مراجع موثوقة لضمان الدقة وتقصي الحقائق. كما يتيح للمستخدمين تقييم إجاباته وتقديم ملاحظاتهم للمساهمة في تحسين أدائه.
تطبيقات عربية متنوعة ضمن مشروع "فنار"
يتضمن مشروع فنار العديد من التطبيقات التي تسهم في إثراء المحتوى العربي. ومن بين هذه التطبيقات "غرفة الأخبار"، وهي منصة تهدف إلى تعزيز المحتوى الإخباري من خلال كتابة المقالات والترجمة وإنشاء أسئلة للمقابلات الصحفية والبحث في الأرشيف الإخباري وإنتاج مواد صوتية ومرئية.
من بين هذه التطبيقات أيضاً "علامة"، وهو بوت دردشة يمكنه الإجابة على أسئلة حول المعاملات الحكومية في قطر، باستخدام تقنية التوليد المعزز بالاسترجاع (RAG). ويدمج "علامة" مصادر بيانات محلية مع قواعد معرفة خارجية، ما يوفر إجابات دقيقة وملائمة لسياق الأسئلة المطروحة.
وتضم التطبيقات الأخرى "حدث كتابك"، وهي منصة تواصل اجتماعي للحوار مع الكتب باستخدام تقنيات الذكاء الاصطناعي، حيث يمثل كل كتاب في صورة مستخدم على المنصة، ويستطيع المشاركون التفاعل مع الكتب من خلال طرح أسئلة عن المحتوى.
ويعتمد المشروع على قاعدة بيانات ضخمة تحتوي على أكثر من 300 مليار كلمة وأكثر من تريليون مقطع لفظي عربي، ما يمنحه قدرة عالية على معالجة اللغة الطبيعية بدقة. ويشير التقرير الفني للمشروع، المنشور على منصة "أركايف"، إلى أن فنار يتضمن نموذجين لغويين كبيرين للغة العربية يتمتعان بكفاءة عالية، هما فنار ستار (Fanar Star) الذي يحتوي على 7 مليارات معامل وسيط، وفنار برايم (Fanar Prime) الذي يحتوي على 9 مليارات معامل. ويُعد هذان النموذجان الأفضل في فئتهما وفقاً لمعايير الأداء للنماذج المماثلة، بحسب ما ورد في التقرير. ويعمل النموذجان معاً في وقت واحد، حيث يتم توجيه الطلبات إليهما بمرونة من خلال نظام تنسيق مخصص مصمم للتعامل بذكاء مع أنواع مختلفة من الاستفسارات.
ويساهم 5 متعاونون من المؤسسات الوطنية القطرية، وهم وزارة الأوقاف والشؤون الإسلامية ومكتبة قطر الوطنية وقناة الجزيرة والمركز العربي للأبحاث ودراسة السياسات وجامعة قطر، في إثراء قاعدة بيانات "فنار" بمعلومات جديدة بشكل مستمر.
الذكاء الاصطناعي يحفظ ويرمم التراث اللغوي والثقافة العربية
لا تقتصر فوائد الذكاء الاصطناعي على الاستخدامات الآنية فحسب، بل تمتد لتشمل حفظ التراث اللغوي والأدبي العربي وترميمه وجعله في متناول الأجيال القادمة. وتتيح تقنيات معالجة اللغات الطبيعية إمكانية رقمنة وتحليل النصوص العربية التاريخية، مثل المخطوطات والوثائق القديمة، على نحو لم يكن ممكناً من قبل. كما يمكن تدريب النماذج اللغوية على نصوص التراث العربي لفهمها وترجمتها وتبسيطها، ما يساعد الباحثين في اللغات والتاريخ على استخراج المعلومات وإحيائها.
ويقول الدكتور إبراهيم محمد زين، أستاذ الدراسات الإسلامية ومقارنة الأديان في كلية الدراسات الإسلامية بجامعة حمد بن خليفة، عضو مؤسسة قطر، إن الذكاء الاصطناعي يؤدي دوراً فاعلاً في حفظ التراث وتقديمه للناس بصورة ممنهجة ومنظمة، مشيراً إلى أن هناك مستوى آخر من استخدامات الذكاء الاصطناعي يشمل كيفية جعل هذا التراث فاعلاً في حياتنا، بدلاً من الاكتفاء بجمعه وتنظيمه.
ومن المشاريع التي تجسد هذه الرؤية مشروع السيرة الرقمية، وهو مبادرة من الشيخة موزا بنت ناصر، رئيس مجلس إدارة مؤسسة قطر، ويعكس تطلعات مؤسسة قطر لتولي المبادرات والمشاريع التي تخدم السيرة النبوية الشريفة.
من جانبه، يرى الدكتور أحمد علي، الباحث في قسم تقنيات اللغة العربية في معهد قطر للبحوث والحوسبة، أن الذكاء الاصطناعي يمكن أن يكون مفيداً في تعميق فهمنا وتحليلنا للمعلومات والثقافة العربية. كما يتيح التعرف على اللهجات العربية المختلفة والتمييز بينها. على سبيل المثال، يمكن للذكاء الاصطناعي رصد الفروق في النطق وطريقة التشكيل بين المتحدثين السوريين والجزائريين والمصريين، ما يجعله أداة قيمة للتمييز بين اللهجات العربية المختلفة.
إن الحفاظ على اللغة العربية في العصر الرقمي ليس ترفاً ولا مجرد مسؤولية ثقافية فحسب، بل هو ضرورة لضمان تنوع المعرفة عالمياً وعدم حصر تدفق المعلومات في لغة واحدة. ومن هذا المنطلق، يقول الدكتور حمدي مبارك حسين، وهو مهندس برمجيات رئيسي بقسم تقنيات اللغة العربية في معهد قطر لبحوث الحوسبة، إن "الحفاظ على الثقافة والهوية العربية يعد هدفاً أساسياً في المعهد، حيث نركز في أوراقنا البحثية ونماذجنا وتطبيقاتنا على ترسيخ المكانة المستحقة للغة العربية ومنحها تمثيلاً أكبر في المجال الرقمي".
ويضيف: يعمل فريقنا حالياً على تطويرِ أدوات وتقنيات تدعم تعلم اللغة العربية في المدارس، وتساعد على تحسين مهارات الكتابة والقراءة لدى الطلاب. كما يعمل المعهد على تطوير نماذج ترجمة آلية قادرة على ترجمة اللهجات العربية، مثل القطرية، إلى اللغة العربية الفصحى أو الإنجليزية. وتعتبر منصة "شاهين" مثالاً بارزاً في هذا المجال، فهي نظام آلي يترجم النصوص العربية المكتوبة والمقروءة، ويمكن استخدامه في عدة مجالات منها القطاعان الطبي والحكومي. وبالفعل تعتمد وكالات الأنباء والجهات الحكومية في عملها على هذا النظام بشكل كبير داخل قطر وخارجها، وفقاً للدكتور حسين.