لماذا يصعب تمييز النصوص التي ولدها الذكاء الاصطناعي؟

في الأسبوع الأول من شهر فبراير/ شباط 2023، أصدرت شركة أوبن أيه آي (OpenAI) أداة يمكن استخدامها لكشف النصوص المولّدة باستخدام نموذج تشات جي بي تي (ChatGPT) الذي طورته. ولكن إذا كنت مدرّساً تخشى أن يقدّم الطلاب المقالات المولّدة باستخدام هذا النظام، فالوقت لا يزال باكراً على الاحتفال.

تعتبر هذه الأداة الجديدة بمثابة رد من شركة أوبن أيه آي على احتجاج المدرسين والصحفيين وغيرهم على إطلاق نظام تشات جي بي تي دون إصدار أي أداة تكشف النصوص التي تم توليدها باستخدامه. مع ذلك، لا تزال الأداة الجديدة قيد التطوير، وهي غير موثوقة للأسف. صرحت شركة أوبن أيه آي بأن أداة الكشف عن النصوص المولّدة التي أصدرتها تكشف بشكل صحيح عن نسبة 26% فقط من النصوص المولدة باستخدام الذكاء الاصطناعي.

ما زال طريق الحصول على أداة موثوقة لكشف النصوص المولدة بالذكاء الاصطناعي طويلاً

على الرغم من أنه لا يزال لدى هذه الشركة الكثير من العمل الذي يجب القيام به لتحسين الأداة الجديدة، فإن جودة أدائها ستكون محدودة. ومن المستبعد للغاية أن نحصل على أداة يمكن أن تكشف عن النصوص المولدة باستخدام الذكاء الاصطناعي بدقة 100%. وفقاً للأستاذ في جامعة كولومبيا البريطانية، محمد عبدالمجيد (Muhammad Abdul-Mageed)، والذي يشرف على الأبحاث في مجال معالجة اللغات الطبيعية والتعلم الآلي، يعتبر الكشف عن هذه النصوص صعباً للغاية لأن نماذج الذكاء الاصطناعي اللغوية طُوّرت بهدف توليد النصوص السلسة والتي تشبه تلك التي يؤلفها البشر، كما أن هذه النماذج تحاكي النصوص التي يكتبها البشر.

اقرأ أيضاً: الذكاء الاصطناعي يمكننا من كشف النصوص التي كتبها بنفسه

يقول عبدالمجيد إن العاملين في هذا المجال حالياً منخرطون في منافسة شرسة لتطوير طرق الكشف التي يمكن أن تتماشى مع أقوى نماذج الذكاء الاصطناعي. أصبحت نماذج الذكاء الاصطناعي الجديدة أكثر كفاءة في توليد النصوص التي تتمتع بمستوى أكبر من الطلاقة، ما يجعل أدوات الكشف المتوفرة حالياً متخلّفة.

صممت شركة أوبن أيه آي الأداة الجديدة من خلال ابتكار لغة خاصة بالذكاء الاصطناعي جديدة تماماً وشبيهة باللغة المستخدمة في نموذج تشات جي بي تي. تم تدريب هذه اللغة خصيصاً للكشف عن المخرجات المولدة من قبل النماذج التي تشبهها. على الرغم من جهلنا بالكثير من التفاصيل حول هذه الأداة، يبدو أن خبراء هذه الشركة قاموا بتدريب النموذج الجديد باستخدام أمثلة عن النصوص المولدة من قبل الذكاء الاصطناعي والأمثلة عن النصوص التي كتبها البشر، ثم قاموا باستخدام النموذج لتمييز النصوص المولدة بالذكاء الاصطناعي. طلب موقع إم آي تي تكنولوجي ريفيو الحصول على المزيد من المعلومات حول النموذج الجديد، ولكن شركة أوبن أيه آي لم تستجب.

العلامات المائية الرقمية كحل محتمل

كتبتُ مقالاً في شهر يناير/ كانون الثاني 2023 عن طريقة أخرى للكشف عن النصوص المولدة بالذكاء الاصطناعي، وهي العلامات المائية الرقمية. يمكن استخدام هذه العلامات كإشارات سرية في النصوص المولدة باستخدام الذكاء الاصطناعي تتيح لبرامج الحاسوب تمييز هذه النصوص.

طوّر الباحثون في جامعة ميريلاند طريقة رائعة لوسم النصوص المولدة باستخدام نماذج الذكاء الاصطناعي بالعلامات المائية الرقمية. وهي طريقة متاحة للعموم بالمجان. تتيح لنا هذه العلامات كشف النصوص المولدة بالذكاء الاصطناعي بدقة شبه تامة.

لكن تكمن المشكلة في أن هذه الطريقة تتطلب من شركات الذكاء الاصطناعي استخدام العلامات المائية الرقمية في بوتات الدردشة الخاصة بها منذ البداية. تقوم شركة أوبن أيه آي بتطوير الأنظمة التي تتضمن هذه العلامات، ولكنها لم تصدر أي منتج يعتمد عليها حتى الآن. وقد يتمثل أحد أسباب ذلك في أن وسم النصوص المولدة باستخدام الذكاء الاصطناعي بالعلامات المائية الرقمية ليس خياراً مفضلاً في جميع الحالات.

تتمثل إحدى الطرق الواعدة التي يمكن من خلالها مكاملة النماذج مثل تشات جي بي تي في المنتجات هي استخدامها كأدوات لكتابة رسائل البريد الإلكتروني أو كمدققات إملائية عالية الأداء في برامج معالجة النصوص. لن يعتبر ذلك غشاً بكل معنى الكلمة. لكن من شأن وسم جميع النصوص المولدة بالذكاء الاصطناعي بالعلامات المائية الرقمية أن يثير الانتباه تلقائياً لهذه المخرجات، ما قد يؤدي إلى اتهامات باطلة.

تعتبر الأداة الجديدة التي أطلقتها شركة أوبن أيه آي واحدة من العديد من أدوات الكشف عن النصوص المولدة بالذكاء الاصطناعي. وفي المستقبل، من المرجح أن نضطر لاستخدام أكثر من أداة للكشف عن هذه النصوص. تقيس أداة أخرى تحمل اسم جي بي تي زيرو (GPTZero) مدى العشوائية في مقاطع النصوص. تولّد نماذج الذكاء الاصطناعي اللغوية النصوص التي تحتوي على الكثير من الكلمات المكررة، بينما يستخدم البشر كلمات متنوعة عند الكتابة. وفقاً لعبدالمجيد، يفضّل استخدام أكثر من أداة لكشف النصوص المولدة بالذكاء الاصطناعي، كما نفعل عندما نستشير أكثر من طبيب لتشخيص مرض ما.

قد يتمثل أحد أكبر التغييرات التي أحدثها نموذج تشات جي بي تي في أنه غيّر الطريقة التي نقيّم بها النصوص المكتوبة. يقول الباحث في مجال الذكاء الاصطناعي، سيباستيان راشكا (Sebastian Raschka)، والذي يعمل في شركة لايتنينغ أيه آي (Lightning.AI) المتخصصة في الذكاء الاصطناعي، إنه في المستقبل، ربما لن يضطر الطلاب لكتابة جميع النصوص من الصفر، وسينصب التركيز على صياغة الأفكار المبتكرة. في نهاية المطاف، ستصبح المقالات والنصوص المولدة باستخدام نموذج تشات جي بي تي أكثر شبهاً ببعضها لأن الأفكار التي يمكن صياغتها باستخدامه ستنفد نظراً لأنه مقيّد بطريقة برمجته والبيانات التي تستخدم لتدريبه.

يقول راشكا: "ستصبح الكتابة بشكل صحيح لغوياً أكثر سهولة، ولكن كتابة الأفكار الجديدة ستصبح أكثر صعوبة".