ما هو هدف جوجل من إتاحة إمكانية تمييز النصوص المولّدة بالذكاء الاصطناعي للجميع؟

4 دقيقة
ستيفاني آرنيت/إم آي تي تكنولوجي ريفيو | أدوبي ستوك

طوّرت شركة جوجل ديب مايند (Google DeepMind) أداة لكشف النصوص المُوَلدة بالذكاء الاصطناعي، وقررت أن تجعلها مفتوحة المصدر.

تحمل الأداة اسم "سينث آي دي" (SynthID)، وهي جزء من مجموعة أكبر من أدوات العلامات المائية المخصصة لمخرجات الذكاء الاصطناعي التوليدي. كشفت الشركة الستار عن علامتها المائية المخصصة للصور العام الماضي، وأطلقت منذ ذلك الحين علامة مائية أخرى لمقاطع الفيديو المولَّدة بالذكاء الاصطناعي. في مايو/أيار، أعلنت جوجل أنها ستدمج سينث آي دي في تطبيق جيميناي (Gemini) وبوتات الدردشة العاملة عبر الإنترنت، وجعلتها متاحة مجاناً على موقع هاغينغ فيس (Hugging Face)، وهو مخزن مفتوح للنماذج ومجموعات البيانات الخاصة بالذكاء الاصطناعي. ظهرت العلامات المائية بوصفها أداة مهمة لمساعدة الناس على كشف المواد المولَّدة بالذكاء الاصطناعي، وهو ما يمكن أن يساعد على مواجهة الأضرار مثل المعلومات المزيفة.

اقرأ أيضاً: جوجل ديب مايند تدرب روبوتاً للتغلب على البشر في تنس الطاولة

علامات مائية مفتوحة المصدر تسهّل عمل المطورين

يقول نائب الرئيس للأبحاث في جوجل ديب مايند، بوشميت كولي: "الآن، سيتمكن مطورو برمجيات الذكاء الاصطناعي التوليدي الآخرون من استخدام هذه التكنولوجيا لمساعدتهم على كشف المخرجات النصية التي تولدها نماذجهم اللغوية الكبيرة، ما يسهّل على المزيد من مطوري البرمجيات توخي المسؤولية في بناء أنظمة الذكاء الاصطناعي".

تعمل سينث آي دي من خلال إضافة علامة مائية خفية مباشرة إلى النص عند توليده باستخدام نموذج ذكاء اصطناعي. تعمل النماذج اللغوية الكبيرة من خلال تقسيم اللغة إلى "رموز مميزة" (Tokens)، ثم إجراء تنبؤ مفاده: إذا ظهر رمز معين، فما هو الرمز الأكثر ترجيحاً أن يرد بعده؟ أو بمعنى آخر، ما هي ثنائيات الرموز المتتالية الأكثر شيوعاً في هذه اللغة؟ قد يكون الرمز المميز حرفاً واحداً أو كلمة أو جزءاً من جملة، ويقترن كل رمز بنسبة مئوية تعبّر عن مدى احتمالية أن يكون الكلمة التالية الأنسب في جملة ما. وكلما ارتفعت هذه النسبة المئوية، زاد احتمال استخدام النموذج لهذا الرمز.

تُضيف سينث آي دي معلومات إضافية في مرحلة التوليد من خلال تغيير احتمالية توليد الرموز، على حد توضيح كولي.

ولكشف العلامة المائية وتحديد إن كان النص مولَّداً باستخدام إحدى أدوات ذكاء اصطناعي، تقارن سينث آي دي القيم الاحتمالية المتوقعة للكلمات في النص الذي يتضمن علامة مائية بالقيم الاحتمالية المتوقعة للكلمات في النص الذي لا يتضمنها.

استخدام العلامة المائية سينث آي دي لم يؤثّر في جودة المخرجات

وجدت جوجل ديب مايند أن استخدام العلامة المائية سينث آي دي لم يؤثّر سلباً في جودة النص الناتج عن عملية التوليد أو دقته أو سماته الإبداعية أو سرعة توليده. وقد توصلت الشركة إلى هذا الاستنتاج اعتماداً على تجربة ميدانية ضخمة لأداء سينث آي دي بعد توظيف العلامة المائية في منتجات جيميناي واستخدام الملايين من الناس لها. يُتيح جيميناي للمستخدمين تصنيف جودة الإجابات التي يقدّمها نموذج الذكاء الاصطناعي من خلال النقر على إشارة الإبهام المتجهة إلى الأعلى (الإعجاب) أو النقر على إشارة الإبهام المتجهة إلى الأسفل (عدم الإعجاب).

حلل كولي وفريقه نتائج ما يقارب 20 مليون إجابة ضمت كلا النوعين من إجابات بوت الدردشة، التي تتضمن علامات مائية والتي لا تتضمن علامات مائية. ووجدوا أن المستخدمين لم يلاحظوا أي فرق في الجودة أو الفائدة بين الحالتين. نشر الباحثون نتائجهم بالتفصيل في ورقة بحثية في مجلة "نيتشر" (Nature) مؤخراً. حالياً، تعمل علامة سينث آي دي المائية المخصصة للنصوص على المحتوى الذي تولّده نماذج جوجل فقط، لكن الأمل معقود على أن جعلها مفتوحة المصدر سوف يوسّع نطاق الأدوات التي تتوافق هذه العلامة المائية معها.

اقرأ أيضاً: ما هي تقنية ميتا الجديدة لإضافة العلامات المائية إلى كلام الذكاء الاصطناعي؟

لكن سينث آي دي تعاني بعضاً من أوجه القصور الأخرى. فقد أظهرت العلامة المائية أنها قادرة على مقاومة بعض محاولات التلاعب، مثل اقتطاع النص أو إجراء التعديلات الطفيفة أو إعادة الكتابة، لكنها كانت أقل موثوقية عند إعادة كتابة النص المولَّد بالذكاء الاصطناعي أو ترجمته من لغة إلى أخرى. كما أنها أقل موثوقية في الإجابات المقدمة نتيجة للأوامر النصية التي تطلب معلومات حقيقية، مثل الاستفسار عن عاصمة فرنسا. ويرجع ذلك إلى وجود فرص أقل لتعديل احتمالية الكلمة التالية المحتملة في الجملة دون تغيير الحقائق.

نقاط ضعف العلامات المائية الخاصة بالذكاء الاصطناعي

يقول الأستاذ المساعد في جامعة ميريلاند، سهيل فيزي، الذي درس نقاط ضعف العلامات المائية الخاصة بالذكاء الاصطناعي: "إن النجاح في إضافة علامة مائية موثوقة وغير ملحوظة إلى نص مولَّد باستخدام الذكاء الاصطناعي يمثّل تحدياً أساسياً، لا سيما في السيناريوهات التي تكون فيها مخرجات النموذج اللغوي الكبير شبه محددة، مثل الأسئلة المتعلقة بالحقائق أو مهام توليد الرموز البرمجية".

يقول فيزي إن قرار جوجل ديب مايند بجعل طريقتها المخصصة للعلامات المائية مفتوحة المصدر يمثّل خطوة إيجابية بالنسبة إلى مجتمع الذكاء الاصطناعي. ويُضيف قائلاً: "سيسمح هذا لمجتمع الذكاء الاصطناعي باختبار أدوات الكشف هذه وتقييم مدى فاعليتها في أوضاع مختلفة، ما يساعدنا على تحسين فهمنا لحدود إمكانات هذه التقنيات".

ثمة فائدة أخرى أيضاً، كما يقول مهندس التعلم الآلي في هاغينغ فيس، جواو غانتي. فجعل الأداة مفتوحة المصدر يعني أنه يمكن لأي شخص أن يحصل على الرموز البرمجية ويدمج العلامة المائية في نموذجه دون أي شروط، على حد قول غانتي. سيؤدي هذا إلى تحسين الخصوصية لهذه العلامة المائية، حيث إن مالكها هو القادر وحده على معرفة أسرارها المتعلقة بالتشفير.

يقول غانتي: "مع تسهيل وسائل استخدام العلامة المائية وزيادة القدرة على تأكيد قدراتها، آمل أن تصبح العلامات المائية المعيار السائد في المستقبل، وهو ما من شأنه أن يساعدنا على كشف حالات الاستخدام الخبيث للنماذج اللغوية".

اقرأ أيضاً: جوجل ديب مايند تطلق أداة لإضافة العلامات المائية إلى الصور المولدة بالذكاء الاصطناعي

لكن العلامات المائية ليست حلاً شاملاً، كما تقول مديرة السياسات العالمية في شركة هاغينغ فيس، آيرين سليمان.

تقول سليمان: "تمثّل العلامات المائية أحد جوانب النماذج الأكثر أماناً في منظومة عمل متكاملة تحتاج إلى العديد من التدابير الوقائية المكملة. في الوقت نفسه، حتى بالنسبة إلى المحتوى الذي يولّده البشر فإن فاعلية عملية التحقق من الحقائق متفاوتة".

المحتوى محمي