الرجاء تفعيل الجافاسكربت في متصفحك ليعمل الموقع بشكل صحيح.

نموذج الذكاء الاصطناعي الجديد من ميتا يستطيع ترجمة الكلام بين أكثر من 100 لغة

3 دقيقة
مصدر الصورة: ستيفاني آرنيت/إم آي تي تكنولوجي ريفيو | أدوبي ستوك

أطلقت شركة ميتا نموذج ذكاء اصطناعي جديداً يستطيع ترجمة الكلام من 101 لغة مختلفة. ويمثل هذا النموذج خطوة إلى الأمام نحو الترجمة الفورية في الزمن الحقيقي، حيث تجري ترجمة الكلمات بمجرد خروجها من فم المتكلم.

عادة ما تعتمد نماذج ترجمة الكلام على نهج متعدد الخطوات. أولاً، تترجم الكلام إلى نص، ثم تترجم هذا النص إلى نص بلغة أخرى. وأخيراً، يجري تحويل النص المترجم إلى كلام باللغة الجديدة. قد تكون هذه الطريقة غير فعالة، فضلاً عن أنها عرضة للمشاكل وأخطاء الترجمة في كل خطوة. لكن نموذج ميتا الجديد، الذي يسمى "سيملس إم فور تي" (SeamlessM4T)، يتيح الاعتماد على طريقة مباشرة بخطوات أقل، للترجمة من الكلام بلغة ما إلى الكلام بلغة أخرى. وقد نشرت مجلة "نيتشر" (Nature) مؤخراً ورقة بحثية تتضمن وصفاً لهذا النموذج.

ميزات نموذج "سيملس إم فور تي" (SeamlessM4T) لترجمة الكلام

يستطيع سيملس ترجمة النص بدقة تفوق أفضل النماذج الحالية بنسبة 23%. وعلى الرغم من أن نموذج أوديوبالم (AudioPaLM) من جوجل يستطيع من الناحية التقنية أن يترجم لغات أكثر -113 لغة، أي أكثر من سملس الذي يترجم 101 لغة- فإنه يستطيع ترجمتها فقط إلى الإنجليزية، على حين يستطيع سيملس إم فور تي أن يترجم إلى 36 لغة أخرى.

يكمن السر في عملية تسمى "التنقيب في البيانات على التوازي" (parallel data mining)، التي تبحث عن الحالات التي يتطابق فيها الصوت في مقطع فيديو أو مقطع صوتي مع ترجمة مكتوبة بلغة أخرى من مجموعة بيانات جرى جمعها من الويب بطريقة منهجية وآلية باستخدام برامج مخصصة لذلك (web crawler). وقد تعلم النموذج الربط بين هذه الأصوات المنطوقة بلغة معينة مع المقاطع النصية الموافقة لها من لغة أخرى. وهذا فتح المجال أمام مجموعة جديدة بالكامل من أمثلة الترجمات لهذا النموذج.

يقول أستاذ علوم الكمبيوتر في جامعة كوينيبياك، تشيتان جايسوال، الذي لم يشارك في البحث: "أنجزت ميتا عملاً رائعاً من خلال توفير مجموعة واسعة من العمليات التي تدعمها، مثل التحويل من نص إلى كلام، ومن كلام إلى نص، وحتى التعرف التلقائي على الكلام. إن مجرد تمكنها من دعم هذا العدد من اللغات يمثل إنجازاً هائلاً".

اقرأ أيضاً: أفضل خدمات الترجمة الآلية الفورية التي تدعم اللغة العربية

ما زالت هناك حاجة للمترجمين البشر

يقول الباحثون في الورقة البحثية إن المترجمين البشر ما زالوا يشكلون جزءاً مهماً جداً من عملية الترجمة، لأنهم يستطيعون إدراك السياقات الثقافية المتنوعة، وضمان نقل المعنى نفسه من لغة إلى أخرى. تقول الباحثة التي تشغل كرسي البحث الكندي في الترجمة والتكنولوجيات والمجتمع في جامعة لافال في مدينة كيبيك، لين باوكر، التي لم تشارك في مشروع سيملس، إن هذه الخطوة مهمة، وتضيف قائلة: "تمثل اللغات انعكاساً للثقافات، وتمتلك الثقافات طرقها الخاصة في إدراك الأشياء".

تقول باوكر إن الأمر عندما يتعلق بتطبيقات مثل الطب أو القانون، يجب الاعتماد على البشر لتدقيق الترجمات الآلية بصورة معمقة، وإلا فقد ينتج عن ذلك ترجمات خاطئة. على سبيل المثال، عندما جرى استخدام خدمة ترجمة جوجل (Google Translate) لترجمة بعض معلومات الصحة العامة حول لقاح كوفيد-19 من مديرية الصحة العامة في ولاية فيرجينيا في شهر يناير/كانون الثاني من عام 2021، ترجمت عبارة "غير إلزامي" (not mandatory) باللغة الإنجليزية إلى "غير ضروري" (not necessary) باللغة الإسبانية، ما أدى إلى تغيير معنى الرسالة بالكامل.

تحديات تواجه انتشار النموذج

ثمة أمثلة كثيرة لتدريب نماذج الذكاء الاصطناعي في بعض اللغات مقارنة باللغات الأخرى. وهذا يعني أن النماذج الحالية لترجمة الكلام إلى الكلام قد تتمكن من ترجمة لغة مثل اليونانية إلى الإنجليزية، حيث قد يكون هناك أمثلة كثيرة، لكنها لن تستطيع الترجمة من السواحلية إلى اليونانية. وقد حاول الفريق الذي صمم سيملس حل هذه المشكلة من خلال التدريب المسبق للنموذج على ملايين الساعات من المقاطع الصوتية المنطوقة بلغات مختلفة.

وقد سمحت عملية التدريب المسبق هذه للنموذج بالتعرف على الأنماط العامة في اللغة، ما يزيد سهولة معالجة اللغات الأقل انتشاراً، لأن النموذج يمتلك أساساً جيداً إلى حد ما حول الخصائص الصوتية للغة المنطوقة.

صمم الباحثون النظام ليكون مفتوح المصدر، ويأملون بأن هذا سيشجع الآخرين على البناء على أساس قدراته الحالية. لكن البعض يشككون في مدى فائدته مقارنة بالبدائل المتاحة. يقول جايسوال: "نموذج جوجل للترجمة ليس مفتوح المصدر على غرار سيملس، لكنه يتفوق عليه كثيراً من حيث الاستجابة والسرعة، علاوة على أنه لا يكلف الأكاديميين شيئاً".

اقرأ أيضاً: هل الذكاء الاصطناعي سيجعل تعلُّم اللغات عديم الفائدة؟

إن الميزة الأكثر إثارة للحماسة في نظام ميتا هي أنه يمثل دلالة على إمكانية بناء نظام للترجمة الفورية بين اللغات في المستقبل القريب، على غرار سمكة بابل في رواية دوغلاس آدمز الشهيرة: "دليل المسافر إلى المجرة" (The Hitchhiker's Guide to the Galaxy). سيملس إم فور تي أسرع من النماذج الحالية، لكنه ما زال غير فوري. وعلى الرغم من هذا، تزعم ميتا أن لديها إصداراً أحدث من سيملس يضاهي المترجمين البشر في سرعته.

يقول مدير مختبر أرلينغتون لعلم اللسانيات الحاسوبية في جامعة تكساس في مدينة أرلينغتون، كيني جو، الذي لم يشارك في البحث الجديد: "على الرغم من أن الترجمة مع هذه الدرجة من التأخير مقبولة ومفيدة، فإنني أعتقد أن الترجمة الفورية ستكون حتى أكثر فائدة".

المحتوى محمي