هل جربت استخدام بياناتك لإنتاج نُسخ مزيفة عميقة منك؟ النتيجة قد تجعلك تدق ناقوس الخطر

4 دقيقة
هل جربت استخدام بياناتك لإنتاج نُسخ مزيفة عميقة منك؟ النتيجة قد تجعلك تدق ناقوس الخطر
حقوق الصورة: shutterstock.com/Pachenko Vladimir

وصلت المزيفات العميقة إلى مستوى عالٍ من الدقة والإتقان. عالٍ للغاية. منذ فترة وجيزة، ذهبت إلى ستوديو في شرق لندن لبناء نسخة رقمية مني في شركة الذكاء الاصطناعي الناشئة سينثيزيا (Synthesia). بنت الشركة نسخة عميقة التزييف بتصميم واقعي للغاية بدا مطابقاً لي من حيث الشكل والصوت، مع نبرة كلام واقعية. تمثل هذه الشخصية الرمزية الرقمية مرحلة متقدمة للغاية بالمقارنة مع الأجيال السابقة المليئة بالأخطاء من الشخصيات الرمزية الرقمية. لقد كانت النتيجة النهائية مذهلة للغاية. ويمكن بسهولة أن تخدع شخصاً لا يعرفني جيداً.

تمكنت سينثيزيا من بناء شخصيات رمزية رقمية معدة للذكاء الاصطناعي بتصاميم قريبة للغاية من البشر بعد سنة واحدة فقط من التجارب والتعديلات على أحدث جيل من الذكاء الاصطناعي التوليدي.

من المثير للحماسة والرهبة بالقدر نفسه التفكير في الاتجاه الذي ستسلكه هذه التكنولوجيا. فقريباً، سيصبح التمييز بين ما هو حقيقي وما هو خيالي صعباً للغاية، وهذه مشكلة فائقة الخطورة إذا أخذنا بالاعتبار العدد غير المسبوق من الانتخابات التي سيشهدها العالم هذه السنة.

نحن لسنا مستعدين لما هو قادم

إذا تجاوزت شكوك الناس إزاء المحتوى الذي يرونه عتبة معينة، فمن المحتمل أن يكفوا عن تصديق أي شيء على الإطلاق، ما يمكن أن يتيح للجهات الخبيثة فرصة استغلال هذا الفراغ في الثقة، وإطلاق الأكاذيب بشأن صحة المحتوى الحقيقي. وقد أطلق الباحثون على هذه الظاهرة اسم "أرباح الكاذب" (liar’s dividend). يحذر الباحثون من أن يبادر السياسيون، على سبيل المثال، إلى الزعم بأن المعلومات التجريمية الحقيقية هي معلومات مزيفة أو مُوَلدة باستخدام الذكاء الاصطناعي.

نشرت مؤخراً مقالاً حول التجربة التي خضتها في أثناء إنشاء شخصيتي الرقمية العميقة التزييف، وعن الأسئلة الجوهرية حول عالم بدأنا نفقد فيه تدريجياً قدرتنا على تمييز الأشياء الحقيقية. يمكنك أن تقرأه هنا. لكن ثمة سؤال جوهري آخر: ما الذي يحدث لبياناتنا بعد تقديمها إلى شركات الذكاء الاصطناعي؟

تقول سينثيزيا إنها لا تبيع البيانات التي تجمعها من الممثلين والعملاء، على الرغم من أنها تنشر بعضها لأغراض الأبحاث الأكاديمية. تستخدم الشركة الشخصيات الرمزية الرقمية مدة ثلاث سنوات، وبعدها تسأل الممثلين إن كانوا يرغبون في تجديد عقودهم. فإذا وافقوا على ذلك، بات عليهم أن يزوروا الاستوديو لإنشاء شخصية رمزية رقمية جديدة. أما في حالة الرفض، تحذف الشركة بياناتهم.

غير أنه ثمة شركات أخرى تفتقر إلى المستوى نفسه من الشفافية فيما يتعلق بنواياها. وكما كتبت زميلتي آيلين غوو السنة الماضية، فإن الشركات مثل ميتا ترخص بيانات الممثلين -بما في ذلك وجوههم وتعابيرهم- بطريقة تسمح للشركات بأن تتصرف بها كما تشاء. تدفع هذه الشركات للممثلين مبالغ أولية صغيرة، لكنها يمكن أن تستخدم أشكالهم بعد ذلك على الدوام في تدريب نماذج الذكاء الاصطناعي دون علمهم.

اقرأ أيضاً: كيف تنشئ بيانات وهمية لتدريب نماذج الذكاء الاصطناعي؟

مصير البيانات

وحتى إذا كانت العقود المتعلقة بالبيانات شفافة، فإنها تصبح لاغية في حالة الوفاة، كما يقول الأستاذ المساعد في جامعة أوبسالا، كارل أومان، الذي درس البيانات التي تركها الأشخاص المتوفون على الإنترنت، ومؤلف كتاب جديد يحمل عنوان "مصير البيانات بعد الموت" (The Afterlife of Data).

قد ينتهي المطاف بالبيانات التي ندخلها في منصات التواصل الاجتماعي أو نماذج الذكاء الاصطناعي إلى إفادة الشركات والبقاء فترة طويلة بعد رحيلنا عن هذا العالم. يقول أومان: "من المتوقع أن يصل عدد حسابات الأشخاص المتوفين على منصة فيسبوك خلال العقدين المقبلين إلى مليارين تقريباً". ويضيف: "هذه الحسابات ليست مجدية تجارياً في الواقع. فالموتى لا ينقرون على أي إعلانات، لكن حساباتهم تشغل مساحة على خوادم المنصة على أي حال".

يمكن استخدام هذه البيانات لتدريب نماذج ذكاء اصطناعي جديدة، أو التوصل إلى استنتاجات حول أولاد هؤلاء المستخدمين المتوفين وأحفادهم. يقول أومان إن نموذج البيانات والموافقة المتعلق بالذكاء الاصطناعي يعتمد بالكامل على فرضية مفادها أن صاحب البيانات والشركة سيعيشان إلى الأبد.

البيانات: السلعة الرائجة

تُعدّ بياناتنا بضاعة رائجة، فنماذج الذكاء الاصطناعي اللغوية مُدَربة باستخدام بيانات تُستخرج من الإنترنت بصورة عشوائية، وهي تتضمن بياناتنا الشخصية أيضاً. منذ سنتين تقريباً أجريت تجربة على جي بي تي 3 (GPT-3)، وهو سلف النموذج اللغوي الذي يعتمد عليه تشات جي بي تي (ChatGPT)، لمعرفة إن كان لديه أي معلومات عني. واجهت صعوبات خلال التجربة، لكنني اكتشفت أنني قادر على جلب معلومات شخصية حول رئيس تحرير مجلة إم آي تي تكنولوجي ريفيو (MIT Technology Review)، مات هونان.

تتسم البيانات العالية الجودة التي يكتبها البشر بأهمية بالغة في تدريب الجيل الجديد من نماذج الذكاء الاصطناعي التي تتمتع بقدرات عالية، وقد وصلنا إلى مرحلة شارفت فيها بيانات التدريب المجانية المتاحة عبر الإنترنت على النفاد. لهذا السبب تسارع شركات الذكاء الاصطناعي إلى إبرام صفقات مع المؤسسات الإخبارية ومؤسسات النشر للوصول إلى كنوز البيانات الموجودة لديها. إضافة إلى ذلك، تمثل مواقع التواصل الاجتماعي القديمة منجم ذهب محتملاً للبيانات، فعندما تتوقف الشركات عن العمل أو تفقد المنصات شعبيتها، تُباع أصولها، بما في ذلك بيانات المستخدمين، إلى الجهة التي تدفع السعر الأعلى، كما يقول أومان. "لقد اشتُرِيَت بيانات موقع ماي سبيس (MySpace) وبيعت عدة مرات منذ أن انهارت الشركة. وقد تواجه شركة سينثيزيا أو منصة إكس (X) أو منصة تيك توك (TikTok) مصيراً مماثلاً"، كما يقول أومان. يضيف أومان قائلاً إن بعض الأشخاص قد لا يكترثون كثيراً بما يحدث لبياناتهم. لكن ضمان الوصول الحصري إلى البيانات العالية الجودة يساعد على ترسيخ الموقع الاحتكاري للشركات الكبيرة، وهذا يضر بنا جميعاً. يقول أومان إنه يتعين علينا التعامل مع هذه المسألة على مستوى المجتمع.

اقرأ أيضاً: تعرّف إلى جيميني 1.5 برو آخر إصدارات جوجل التي تعالج كميات كبيرة من البيانات

قالت سينثيزيا إنها ستحذف شخصيتي الرقمية بعد تجربتي، لكن التجربة بأسرها دفعتني إلى التفكير في صوري ومنشوراتي المحرجة كلها على فيسبوك وغيرها من منصات التواصل الاجتماعي، التي ما زالت تطارد تفكيري حتى اللحظة. أعتقد أن الوقت قد حان لحذفها كلها.

المحتوى محمي