هل يمكن التلاعب بالعلامات المائية في النصوص التي ينتجها الذكاء الاصطناعي؟

وجد الباحثون أنه من السهل إزالة العلامات المائية في النصوص التي ينتجها الذكاء الاصطناعي أو سرقتها أو نسخها، ما يجعلها عديمة الفائدة. ويقول الباحثون إن هذا النوع من الهجمات يقوض مصداقية العلامات المائية، كما يمكن أن يخدع الناس ويدفعهم إلى الثقة بنصوص غير موثوقة.

استخدام العلامات المائية في نماذج الذكاء الاصطناعي

تعتمد العلامات المائية على دمج أنماط خفية في النصوص التي ينتجها الذكاء الاصطناعي، ما يتيح لأجهزة الكمبيوتر كشف النص على أنه من إنتاج نظام ذكاء اصطناعي. تُعَد هذه العلامات اختراعاً جديداً نسبياً، لكنها سرعان ما تحولت إلى حل ذائع الصيت من أجل مكافحة مشاكل استخدام الذكاء الاصطناعي في إنتاج المعلومات المضللة والسرقة الفكرية. على سبيل المثال، فإن قانون الذكاء الاصطناعي الذي أقره الاتحاد الأوروبي، والذي سيدخل حيز التنفيذ في مايو/أيار، سيفرض على المطورين تطبيق العلامات المائية على المحتوى الذي ينتجه الذكاء الاصطناعي. لكن بحثاً جديداً يبين أن أحدث إنتاجات تكنولوجيا العلامات المائية لا يصل إلى مستوى متطلبات الجهات الرقابية، كما يقول طالب الدكتوراة في المعهد الاتحادي السويسري للتكنولوجيا في زيوريخ، وعضو الفريق الذي طور الهجمات، روبن ستاب. لم يخضع البحث بعد إلى مراجعة الأقران.

اقرأ ايضاً: هل إضافة العلامات المائية إلى صور الذكاء الاصطناعي مجدية في محاربة التزييف؟

تعمل نماذج الذكاء الاصطناعي اللغوية من خلال التنبؤ بالكلمة التي من المحتمل أن ترد تالياً في الجملة، حيث تولد النصوص كلمة تلو الأخرى بناء على هذه التنبؤات. تعمل خوارزمية العلامات المائية المخصصة للنصوص من خلال تقسيم مخزون مفردات النموذج اللغوي إلى "قائمة خضراء" و"قائمة حمراء" من الكلمات، ودفع نموذج الذكاء الاصطناعي اللغوي إلى اختيار الكلمات من القائمة الخضراء. وكلما زادت نسبة كلمات القائمة الخضراء المستخدمة في الجمل، زاد احتمال أن يكون النص من إنتاج كمبيوتر. يميل البشر إلى كتابة جمل تتضمن مزيجاً عشوائياً من الكلمات.

انتحال العلامات المائية

وقد تلاعب الباحثون بـ 5 علامات مائية تعمل وفق الطريقة المذكورة أعلاه. وقد تمكن الباحثون من تطبيق الهندسة العكسية على العلامات المائية من خلال استخدام واجهة برمجة التطبيقات (API) للوصول إلى نموذج الذكاء الاصطناعي الذي طُبِقَت عليه العلامة المائية، وتوجيه أوامر نصية له مرات عديدة، كما يقول ستاب. تتيح الإجابات للمهاجمين "سرقة" العلامة المائية من خلال بناء نموذج تقريبي لقواعد العلامة المائية. ينفذ المهاجمون هذه العملية من خلال تحليل مخرجات نظام الذكاء الاصطناعي، ومقارنتها بنصوص عادية.

وبعد أن تتكون لدى الباحثين فكرة تقريبية عن الكلمات ذات العلامة المائية، فإن ذلك يتيح لهم تنفيذ نوعين من الهجمات. يسمى النوع الأول "هجوم الانتحال" (spoofing attack)، ويتيح للأطراف الخبيثة استخدام المعلومات التي حصلوا عليها من خلال سرقة العلامة المائية لإنتاج نص يمكن تمريره على أنه نص يتضمن العلامة المائية الفعلية. أما النوع الثاني فيتيح للمخترقين تجريد النص الذي ولده الذكاء الاصطناعي من العلامة المائية، بحيث يمكن تمرير النص على أنه نص من إنتاج بشري.

بلغت نسبة نجاح الفريق في انتحال العلامات المائية 80% تقريباً، كما بلغت نسبة النجاح في تجريد نصوص الذكاء الاصطناعي من علامتها المائية 85%.

اقرأ ايضاً: مَن يملك حقوق ملكية الأعمال الفنية التي يولّدها الذكاء الاصطناعي؟

موثوقية العلامات المائية

أيضاً، وجد باحثون آخرون غير مرتبطين بفريق المعهد الاتحادي السويسري للتكنولوجيا في زيوريخ، مثل الأستاذ المساعد ومدير مختبر الذكاء الاصطناعي الموثوق (Reliable AI Lab) في جامعة ميريلاند، سهيل فيزي، أن العلامات المائية غير موثوقة ومعرضة للاختراق من خلال هجمات الانتحال.

تؤكد نتائج المعهد الاتحادي السويسري للتكنولوجيا في زيورخ أن هذه المشاكل في العلامات المائية موجودة فعلياً وتمتد إلى أكثر أنواع بوتات الدردشة والنماذج اللغوية الكبيرة الحالية تطوراً، كما يقول فيزي.

ويقول إن البحث "يؤكد أهمية توخي الحذر عند تطبيق آليات الكشف هذه على نطاق واسع".

على الرغم من هذه النتائج، ما زالت العلامات المائية أفضل وسيلة واعدة لكشف المحتوى الذي أنتجه الذكاء الاصطناعي، كما يقول طالب الدكتوراة في المعهد الاتحادي السويسري للتكنولوجيا في زيوريخ، نيكولا يوفانوفيتش، الذي عمل في البحث.

لكنه يضيف قائلاً إننا ما زلنا في حاجة إلى إجراء المزيد من الأبحاث حتى تصبح العلامات المائية جاهزة للتطبيق على نطاق واسع. وحتى ذلك الحين، يجب أن نتحلى بالواقعية من حيث توقعاتنا حول وثوقية هذه الأدوات وفائدتها. يقول يوفانوفيتش: "إذا لم تحقق هذه الأدوات النتيجة المرجوة فعلاً، فهي ما تزال مفيدة على أي حال".