ما هو توليد اللغة الطبيعية؟
حقل فرعي من حقول الذكاء الاصطناعي يُعنى بعملية إنتاج عبارات وجمل ومقاطع مكتوبة أو منطوقة ذات معنى باللغة الطبيعية التي يتواصل بها البشر. تقوم أنظمة توليد اللغة الطبيعية بتوليد سرد قصصي يصف أو يخلص أو يشرح بيانات الدخل المهيكلة تلقائياً بطريقة مماثلة لما يقوم به البشر وبسرعة عالية قد تصل إلى آلاف الصفحات في الثانية. وذلك بالاعتماد على تقنيات التعلم الآلي والتعلم العميق والشبكات العصبونية الاصطناعية.
تقتصر مهام نظام توليد اللغة الطبيعية على كتابة النصوص من البيانات المهيكلة، فهو غير قادر على قراءة أو فهم البيانات غير المهيكلة. ولذلك يعمل بشكل متوافق مع نظام فهم اللغة الطبيعية (Natural Language Understanding ). ويعتبران معاً جزءاً من حقل معالجة اللغة الطبيعية، والذي يشمل جميع الأنظمة التي تهدف إلى تفسير أو إنتاج لغة بشرية سواءً بشكل منطوق أو مكتوب.
ما هي تطبيقات توليد اللغة الطبيعية؟
تساعد أنظمة توليد اللغة الطبيعية على جعل البيانات بجميع أشكالها مفهومة لأي شخص، حيث تسهل كتابة التقارير المالية المعتمدة على كميات ضخمة من البيانات العددية، أو اكتشاف الأنماط في مجموعة بيانات ما ومشاركة معلومات عنها بطريقة سهلة الفهم. وتعتبر سرعتها العالية مفيدة للغاية لا سيما في مجال إنتاج الأخبار والتقارير الصحفية الحساسة للوقت، أو حتى في مجال صناعة المحتوى لنشره على مواقع الويب.
فعلى سبيل المثال عندما ضرب زلزال مدينة لوس أنجلوس في عام 2014؛ قامت خوارزمية توليد محتوى طورها المبرمج والصحفي كين شوينك (Ken Schwencke) بنشر الخبر في صحيفة لوس أنجلوس تايمز (L.A. Times) بعد أقل من 8 دقائق من وقوعه، مرفقاً مع خريطة تحدد مركز الزلزال. ومن الأمثلة المهمة أيضاً النموذج اللغوي جي بي تي-3 (GPT-3) الذي يولد نصوص تشبه تلك التي يكتبها البشر.