طريقة جديدة لترويض اللغة التي يولدها الذكاء الاصطناعي وتجنب الإحراج

3 دقائق
حقوق الصورة: إم إس تك

خلال العامَين الأخيرين، شهد مجال معالجة اللغات الطبيعية، وهو حقلٌ فرعي من الذكاء الاصطناعي، تقدماً هائلاً. على سبيل المثال، تم استخدام النموذج المسمى جي بي تي 2، وهو نموذجٌ لغوي طوره مختبر أوبن إيه آي في سان فرانسيسكو، لتوليد قصصٍ خيالية ومقالاتٍ إخبارية مزيفة، وفي لعبة إنتاج نصوصٍ لا نهائية عملياً و"على هوى المستخدم".

لكن النماذج من هذا النوع هي -من حيث الجوهر- أنظمةٌ عملاقة للتنبؤ بالنص دون أن تلقي بالاً لمعناه، لذا من المرجح أن تكون الجمل التي تنتجها أقربَ إلى فصاحةٍ شكلية أكثر من كونها ذات مغزى حقيقي. ومن الصعب إلزام نموذجٍ لغوي بالتقيُّد بموضوعٍ محدد كالرعاية الصحية على سبيل المثال. ومع ذلك، فإنه ما زال من الممكن التلاعب بالنماذج اللغوية مثل جي بي تي 2 من أجل إنتاج سمومٍ رقمية في هيئة نصوصٍ عنصرية ومؤذية، مما يقلِّل من جدوى استخدامها.

وحالياً، قام الباحثون في مختبر أوبر للذكاء الاصطناعي بتطوير طريقةٍ للتوجيه والتحكم في هذه النماذج اللغوية، مما يسهِّل على المستخدمين تحديد الموضوع، بل حتى المشاعر في الجمل التي تولِّدها، وعلى سبيل المثال، إذا استخدمنا الأمر النصّي "ركَّزت القضية على"، فعند إلزام النموذج بالتركيز على الموضوع العسكري، فإنه قد ينتج نصاً شبيهاً بالتالي: "ركَّزت القضية على حقيقة أن الحكومة قد أنفقت المليارات على الجيش وأنه لا يستطيع نشر القوات في الوقت المحدد". وإذا طُلب منه بدلاً من ذلك التركيز على السياسة، فقد يكون النص الناتج أقرب إلى التالي: "ركَّزت القضية على قسمٍ واحد من التشريع. ومن غير الواضح ما إذا كانت اللجنة ستصوِّت لصالح تمديد القانون أم لا".

ورغم أن النموذج ما زال عاجزاً عن فهم المعنى، فإن هذه التقنية تسمح بالمزيد من التحكم؛ حيث تقرِّبنا خطوةً نحو تحقيق قفزاتٍ في مجال اللغة المولَّدة بالذكاء الاصطناعي بما يمكننا من استخدامها في تطبيقاتٍ متخصصة بمجالاتٍ محددة، كالرعاية الصحية أو روبوتات الدردشة في الخدمات المالية. كما يمكن استخدام التقنية في توجيه النماذج بعيداً عن إنتاج نصوصٍ مُسيئة.

توظِّف التقنية نموذجَين إحصائيين منفصلين؛ الأول هو ببساطةٍ النموذج اللغوي الأصلي، مثل جي بي تي 2، الذي يتولى مهمة تركيب الجمل بالاعتماد على احتمالات ظهور كلماتٍ معينة إلى جانب كلماتٍ أخرى. أما النموذج الثاني فيقوم بالحُكم على مدى جودة مخرجات النموذج الأول في إنتاج سمةٍ مرغوبة؛ سواءً كانت هذه السمة هي التقيد بموضوعٍ أو الالتزام بإحساسٍ محدد على سبيل المثال. فإذا كانت السمة المنشودة موضوعاً مثل الفضاء، فقد يسجِّل النموذج الثاني درجةً لمخرجات النموذج الأول بناءً على عدد الكلمات ذات الصلة التي تحتويها، مثل : "كوكب"، "مجرَّة"، "مدار". وإذا كانت السمة تمثِّل إحساساً مثل الإيجابية، يمكن تدريب نموذج التقييم على تسجيل درجةٍ بالاستناد إلى المحتوى العاطفي لكلمات النص.

وعند إدخال أمرٍ نصّي ابتدائي إلى النموذج الأول، سوف يبدأ عملية تنبؤ الكلمات اللاحقة. ولكن بعد كلّ كلمة، يتحقق النموذج من درجتها باستخدام نموذج التقييم ليعيد ضبط مُخرجاته على أساس هذا التقييم. فينتهي المطاف بالجملة الأخيرة محتويةً على السمة المتوخَّاة، مع الحفاظ في نفس الوقت على جودة النموذج اللغوي العملاق.

إن هذا الأسلوب الجديدة مرنٌ جداً ويستطيع الجمع بين أهدافٍ متعددة؛ فعلى سبيل المثال، يمكن توجيهه للكتابة حول الطبخ بنبرةٍ سلبية. كما يتميز هذا الأسلوب بالكفاءة من الناحية الحسابية؛ فعلى الرغم من قدرة الأساليب الأخرى على تركيز النص المُخرج لنموذجٍ لغوي على مواضيع أو مشاعر معينة، إلا أنها تتطلب قدراً كبيراً من إعادة التدريب. وعند القيام بذلك باستخدام نموذجٍ ضخم بحجم جي بي تي 2، سيكون الأمر مكلفاً من الناحيتين البيئية والمالية، حيث يقول سومانث داثاثري، الذي يدرس في معهد كاليفورنيا للتكنولوجيا وشارك في تأليف الورقة البحثية خلال فترة تدريبٍ في أوبر: "لا يملك طالب دراساتٍ عليا مثلي هذا الحجم من الموارد". بينما يتجنب الأسلوب الجديد إعادة التدريب تماماً عن طريق منح المزيد من التحكم لأيّ نموذجٍ موجود بالفعل.

يتوقع الفريق أن يتم استخدام هذه التقنية في العديد من التطبيقات المختلفة، سواءً في أنظمة الحوار أو أنظمة الترجمة أو حتى في مجال الفن. ففي عام 2016، طوَّر المختبر أسلوباً مماثلاً للتحكم في توليد الصور بدلاً من اللغة. ويتذكر العالِم الذي أشرف على ذلك البحث، جاسون يوزينسكي، وهو عضوٌ مؤسس في مختبر أوبر للذكاء الاصطناعي، أنه:"كان هناك الكثير من الفنانين الذين استخدموا أسلوب توليد الصور في إنتاج أعمالٍ فنية رائعة". ويضيف: "أتوقع أن أرى الكثير من الفنانين يستخدمون الأسلوب الجديد في توليد اللغة للقيام بالأمر نفسه".

المحتوى محمي