خلال عام 2019، قامت فيسبوك بحذف حوالي 2 مليار حساب مزيف في المتوسط كلّ 3 أشهر. هذه الحسابات المزيفة يلجأ المحتالون إلى استغلالها في إغراق المستخدمين بالرسائل المزعجة وروابط التصيد والبرمجيات الخبيثة، إنه عملٌ مربح بالنسبة لهم، لكنه مدمِّرٌ تماماً بالنسبة للمستخدمين الأبرياء الذين يقعون في شراكهم.
واليوم، تنشر فيسبوك بعض التفاصيل حول نظام التعلم الآلي الذي تستخدمه لمواجهة هذا التحدي؛ حيث تميز شركة التكنولوجيا العملاقة بين نوعين من الحسابات المزيفة. هناك أولاً "حسابات مستخدمين صنفت خطأ على أنها مزيفة"، وهي ملفاتٌ شخصية لأعمالٍ تجارية أو حيواناتٍ أليفة كان يفترض أن تكون صفحات وليس حساباتٍ شخصية، ومن السهل نسبياً التعامل مع هذا النوع من الحسابات؛ إذ يتم تحويلها إلى صفحات. أما معالجة النوع الثاني -الذي يسمى "حسابات مخالِفة"- فهي أكثر صعوبة، وتندرج ضمن هذا النوع الملفات الشخصية التي تمارس أنشطة الاحتيال والإغراق برسائل الإزعاج أو تلك التي تنتهك شروط الخدمة على المنصة، وينبغي إزالة الحسابات المخالِفة بالسرعة الممكنة مع الحرص على عدم توسيع قواعد الإزالة بشكل كبير يؤدي إلى إيقاف حسابات حقيقية على حدٍّ سواء.
وللقيام بذلك، تستخدم فيسبوك قواعد مبرمجة سابقاً إلى جانب التعلم الآلي من أجل حظر الحساب المزيف إما قبل إنشائه أو قبل أن يتم تنشيطه، بمعنى آخر، قبل أن يتمكن من إلحاق الأذى بالمستخدمين الحقيقيين. فإذا تمكن المحتالون من إنشاء الحساب المزيف وتنشيطه، تبدأ عندها المرحلة الأخيرة، وهي المرحلة التي يغدو فيها تحديد الحسابات المزيفة أكثر صعوبة. وهنا يأتي دور النظام الجديد للتعلم الآلي، المعروف باسم التصنيف العميق للكيانات دي إي سي (DEC).
التمحيص العميق
يتعلم نظام دي إي سي التمييز بين المستخدمين الحقيقيين والمزيفين من خلال أنماط صلاتهم عبر الشبكة، التي يطلق عليها النظام اسم "السمات العميقة"، والتي تتضمن عوامل مثل: متوسط العمر أو توزع جنس أصدقاء المستخدم. وتستخدم فيسبوك أكثر من 20,000 ميزة عميقة لتحديد الخصائص المميزة لكل حساب، مما يقدم لمحةً عن نشاط كل ملف شخصي، وبذلك يصعب على المهاجمين التلاعب بالنظام عبر تعديل تكتيكاتهم.
يبدأ النظام عمله باستخدام عددٍ كبير من الوسوم منخفضة الدقة التي تنتجها الآلة عبر مجموعةٍ من القواعد ونماذج التعلم الآلي التي تقوم بتخمين ما إذا كان الحساب حقيقياًً أو مزيفاً. وبعد أن يتم تدريب شبكة عصبونية على هذه البيانات، يتم ضبط إعدادات النموذج باستخدام مجموعة من البيانات عالية الدقة وموسومة يدوياً، يتولى أشخاصٌ حول العالم مهمة توليدها، وهم أفرادٌ يتمتعون بفهمٍ للمعايير الثقافية المحلية.
يستطيع نظام التصنيف النهائي هذا أن يتعرف على أحد أربعة أنواع من الحسابات المزيفة، وهي: حسابات غير مشروعة لا تمثل الشخص، وحسابات المستخدمين الحقيقيين التي تم الاستيلاء عليها من قِبل المهاجمين، ومرسلو الرسائل المزعجة الذين يقومون دائماً بإرسال رسائل مُدرَّة للدخل، والمحتالون الذين يتلاعبون بالمستخدمين لدفعهم إلى الكشف عن معلوماتٍ شخصية. وتقول فيسبوك إنها -منذ تطبيق نظام دي إي سي- قد تمكنت من السيطرة على حجم الحسابات المزيفة على المنصة وإبقائه عند 5% من المستخدمين النشطين شهرياً.
ويأتي نشر تفاصيل الجهود التي تبذلها فيسبوك في تنظيف منصتها من الحسابات المزيفة في أعقاب تنامي المخاوف من إمكانية حدوث تلاعب في الانتخابات الرئاسية الأميركية المقبلة، وخصوصاً فيما يتعلق بالمحتوى عميق التزييف. وقد أبلغت صحيفة نيويورك تايمز في ديسمبر الماضي عن حملة تضليل منظَّمة باستخدام المحتوى عميق التزييف هدفت إلى تزويد مجموعاتٍ كبيرة من الحسابات المزيفة بصورٍ شخصية مقنعة.
حماية الانتخابات
تقول فيسبوك إن توقيت نشر هذه التفاصيل قبل الانتخابات كان محض صدفة؛ حيث يقول دانييل بيرنهارت، المدير الهندسي لفريق النزاهة المجتمعية قي فيسبوك: "يتعلق الأمر بكشف الانتهاكات بشكلٍ عام، ولا يستهدف أي نوع من المواضيع الانتخابية على وجه التحديد". لكن نظام دي إي سي ليس إلا جزءاً مُكمِّلاً للجهود الأخرى التي تبذلها فيسبوك للحد من التلاعب بالانتخابات. ونظراً لاعتماد النظام على السمات العميقة لتصنيف كل ملف شخصي، فإنه سيصمد على سبيل المثال في وجه محاولات خداعه باستخدام صورٍ عميقة التزييف على الملفات الشخصية.
ويقول أفيف أوفاديا، مؤسس منظمة ثوتفل تيكنولوجي بروجيكت غير الربحية والذي يدرس تصميم المنصة وحوكمتها، إن الجهود التي تبذلها فيسبوك لتحقيق شفافية أكبر فيما يتعلق بإجراءات إزالة الحسابات المزيفة هي جهودٌ جديرة بالثناء. ويضيف: "قد يكون من المفيد والمؤثر أن نتناقش بإمعان حول القرارت التصميمية -وكيفية عمل أنظمة الأمن- التي يمكن للشركات الأخرى أن تحاكيها، ونظراً لامتلاك الشركات مثل فيسبوك لموارد أكبر بكثير من الشركات الأصغر، فإن مشاركة هذه المعرفة ستحمل فوائد كبيرة".
لكن ما زال هناك طريق طويلة أمام جهود تنظيف المنصة من الحسابات المزيفة؛ فمع وجود 2.5 مليار مستخدمٍ نشط شهرياً، فإن نسبة 5% ما زالت تمثل رقماً معتبراً وهو 125 مليون حساب مزيف. لكن هذه هي حدود ما يمكن للتعلم الآلي توفيره؛ فمهما كان حجم بيانات تدريب النموذج، لن يتمكن أبداً من التقاط جميع الحسابات السيئة بدقة مثالية. لذا، من المرجح أن تضطر فيسبوك للنظر في تركيباتٍ أخرى تجمع بين البشر والآلات لتحقيق تقدمٍ في هذا المجال.