استطاع فريق من الباحثين في جامعة نيويورك أبوظبي ابتكار واجهة إلكترونية عامة تعرف باسم: برنامج التعرف التلقائي على اللهجات العربية (ADIDA)، وهو برنامج يستخدم الذكاء الاصطناعي لتصنيف اللهجات العربية المختلفة في 25 مدينة على امتداد الوطن العربي.
وقد شارك في هذا العمل باحثون آخرون من مؤسسات تعليمية مختلفة. وأشرف عليه الدكتور نزار حبش، الأستاذ المشارك في علوم الحاسوب ومدير مختبر الأساليب الحاسوبية لنمذجة اللغة في جامعة نيويورك أبوظبي، وعضو المجلس الاستشاري لمجلة إم آي تي تكنولوجي ريفيو، وأحد حكام جائزة مبتكرون دون 35 لعام 2019. وكان مجموع المشاركين فيه 55 شخصاً من متخصصي اللسانيات ومحبي اللهجات في الـ 25 مدينة، بالإضافة إلى مجموعة من المبرمجين وباحثي الذكاء الاصطناعي.
بحسب جريدة "الشرق الأوسط" فإن البرنامج يعمل عن طريق قيام المستخدمين بإدراج نص باللغة العربية إليه، فتظهر لهم خريطة جغرافية للوطن العربي تبيِّن المدن التي تستخدم هذا النص من ضمن الـ 25 مدينة، ثم يعرض المدن الخمس الأولى التي يحتمل أن تستخدم هذا النص بجانب اللغة العربية الفصحى. وقد ذكر في البيان مثال على هذا بكلمة "ماشي" التي تعني "حسناً" في القاهرة وبيروت، في حين أنها تعني "لا" في صنعاء.
وصرح حبش للشرق الأوسط قائلاً: "إن قاعدة معلومات البرنامج تحتوي على 100 ألف جملة مترجمة من الإنجليزية أو الفرنسية إلى لهجات المدن الـ 25، وتحتوي كذلك على 12 ألف جملة في العربية الفصحى، ويبلغ عدد الكلمات المستخدمة في كل الجمل نحو 800 ألف كلمة، كما تم بناء قاموس متعدد اللهجات يحتوي على 47 ألف مفردة".
قد يهمك: ما هي إنترنت الأشياء؟
ولم يكتفِ الباحثون بلهجة واحدة من كل دولة، بل اعتمدوا أكثر من لهجة داخل الدولة الواحدة، ففي مصر مثلاً اختاروا اللهجات الخاصة بمدن القاهرة والإسكندرية وأسوان، وفي العراق اختاروا لهجات الموصل وبغداد والبصرة. والسبب وراء أنهم يهتمون بلهجات المدن نفسها وليس الدول هو أن هذه اللهجات تختلف اختلافاً ملحوظاً عن بعضها البعض.
بين اللهجات المختلفة واللغة العربية الفصحى الموحّدة
جاءت هذه المبادرة في ظل عدم استيعاب المواطن العربي لجميع لهجات الدول العربية، برغم كونها جميعاً منبثقة عن اللغة العربية الفصحى. وتهدف المبادرة أولاً إلى إيجاد حلول عملية تمكِّن المواطنين العرب من فهم بعضهم البعض.