يقول الخبر
تبين أن البرنامج المسمى تيكست فولر TextFooler يستطيع خداع أنظمة معالجة اللغة الطبيعية وجعلها تخطئ في فهم النص عن طريق استبدال كلمات معينة في الجملة بمرادفاتها وحسب. وفي التجارب، تمكن من تخفيض دقة ثلاثة من أحدث أنظمة معالجة اللغة الطبيعية إلى حد كبير. وعلى سبيل المثال، فقد تراجعت دقة شبكة بيرت العصبونية الفعالة من جوجل بنسبة تتراوح بين الخُمس والسُّبع عند تحديد الطبيعة الإيجابية أو السلبية للتقييمات على موقع يلب Yelp.
طريقة العمل
يقوم البرنامج -الذي طوره فريق في إم آي تي- بالبحث عن الكلمات الأكثر أهمية في الجملة بالنسبة لمُصنِّف معالجة اللغة الطبيعية، ويضع بدلاً منها مرادفات طبيعية بالنسبة للبشر. وعلى سبيل المثال، يمكن أن يغير هذه الجملة: "انفصلت الشخصيات تماماً عن الواقع بعدما وجدت نفسها في أوضاع صعبة" على النحو التالي: "انفصلت الشخصيات تماماً عن الواقع بعدما وجدت نفسها في ظروف عصيبة". لا نجد -نحن البشر- أي فرق بين الجملتين، ولكن هذه التعديلات تؤدي إلى تفسيرات مختلفة تماماً من نظام الذكاء الاصطناعي.
أهمية هذه المسألة
شهدنا من قبل الكثير من الأمثلة حول هذه الهجمات التنافسية، التي تتمحور بشكل أساسي حول أنظمة التعرف على الصور، حيث تكفي تعديلات صغيرة على الدخل لإرباك نظام الذكاء الاصطناعي ودفعه إلى ارتكاب خطأ في التصنيف. ويبين تيكست فولر إمكانية استخدام هذا النمط من الهجوم ضد أنظمة معالجة اللغة الطبيعية أيضاً، التي تعتمد عليها المساعدات الافتراضية -مثل سيري وأليكسا ومساعد جوجل- إضافة إلى غيرها من المصنفات اللغوية، مثل مرشحات البريد المزعج وكواشف خطاب الكراهية. يقول الباحثون إن الأدوات المشابهة لهذا البرنامج يمكن أن تجعل أنظمة معالجة اللغة الطبيعية أكثر دقة في عملها، وذلك بكشف نقاط ضعفها.