لماذا لا يستطيع الذكاء الاصطناعي حل مشاكل التحيز في الدرجات الائتمانية؟

5 دقائق
مشاكل التحيز في الدرجات الائتمانية
مصدر الصورة: إم إس تك| سيندي تانج/ أنسبلاش

نعلم مسبقاً أن البيانات والخوارزميات المتحيزة تسبب تحيزاً في عملية صنع القرار المؤتمتة بطريقة تضر بمجموعات الأقليات وذوي الدخل المنخفض. وعلى سبيل المثال، فإن البرامج التي تستخدمها البنوك للتنبؤ بما إذا كان شخص ما سوف يسدد ديون بطاقة الائتمان أو لا عادةً ما تفضِّل المتقدمين الأكثر ثراءً من ذوي البشرة البيضاء. ويحاول العديد من الباحثين وعدد كبير من الشركات الناشئة حل هذه المشكلة من خلال جعل هذه الخوارزميات أكثر عدلاً.

ولكن في أكبر دراسة على الإطلاق لبيانات الرهن العقاري في العالم الحقيقي، أظهر الاقتصاديان، لورا بلاتنر من جامعة ستانفورد وسكوت نيلسون من جامعة شيكاغو، أن الاختلافات في الموافقة على الرهن العقاري بين مجموعات الأقليات والأغلبية لا يرجع فقط إلى التحيز، ولكن إلى حقيقة أن الأقليات وفئات الدخل المنخفض تمتلك بيانات أقل في تاريخها الائتماني.

وهذا يعني أنه عند استخدام هذه البيانات لحساب درجة الائتمان، ومن ثم استخدام درجة الائتمان هذه للتنبؤ بالتخلف عن سداد القرض، فإن هذا التنبؤ سيكون أقل دقة. وهذا الافتقار إلى الدقة هو ما يؤدي إلى عدم المساواة، وليس فقط التحيز.

يترتب على هذه النتيجة تداعيات كبيرة؛ إذ إنها تعني أن تطوير خوارزميات أكثر عدلاً لن يحل المشكلة.

يقول أشيش رامباتشان، الذي يدرس التعلم الآلي والاقتصاد في جامعة هارفارد لكنه لم يشارك في الدراسة: "إنها نتيجة مذهلة حقاً". لقد حظيت مشاكل سجلات الائتمان غير المكتملة والتحيز باهتمام كبير لبعض الوقت، ولكن هذه الدراسة تمثل أول تجربة واسعة النطاق تبحث في طلبات القروض لملايين الأشخاص الحقيقيين.

تجمع درجات الائتمان مجموعة من البيانات الاجتماعية والاقتصادية، مثل تاريخ التوظيف والسجلات المالية وعادات الشراء، في رقم واحد. وعلاوة على استخدام هذه الدرجات للبت في طلبات القروض، فإنها تستخدم اليوم لاتخاذ العديد من القرارات التي تؤثر على حيوات الأشخاص بشكل كبير بما في ذلك القرارات المتعلقة بالتأمين والتوظيف والإسكان.

في مسعى لاكتشاف سبب معاملة الأقليات والأغلبية بشكل مختلف من قِبل مقرضي الرهن العقاري، قام بلاتنر ونيلسون بجمع تقارير ائتمانية لـ 50 مليون مستهلك مغفل الهوية في الولايات المتحدة، وربط كل من هؤلاء المستهلكين بتفاصيلهم الاجتماعية والاقتصادية المأخوذة من مجموعة بيانات تسويقية، وسندات ممتلكاتهم ومعاملات الرهن العقاري، وبيانات عن مقرضي الرهن العقاري الذين قدموا لهم القروض.

لم يتم إجراء هذا النوع من الدراسات من قبل لعدة أسباب، أهمها أن ملكية مجموعات البيانات هذه غالباً ما تكون خاصة  وغير متاحة للباحثين. تقول بلاتنر: "لقد توجهنا إلى مكتب ائتمان وتوجب علينا أن ندفع لهم الكثير من المال حتى نحصل على البيانات".

بيانات مشوشة

ثم قام الباحثان بتجربة خوارزميات تنبؤية مختلفة لإظهار أن درجات الائتمان لم تكن متحيزة فحسب، وإنما كانت "مشوشة" أيضاً، وهو مصطلح إحصائي يشير إلى البيانات التي لا يمكن استخدامها لإجراء تنبؤات دقيقة. لنأخذ مقدم طلب من الأقليات بدرجة ائتمان 620 على سبيل المثال؛ في نظام متحيز، قد نتوقع أن هذه الدرجة تبالغ دائماً في تقدير مخاطر مقدم الطلب وأن النتيجة الأكثر دقة ستكون 625. من الناحية النظرية، يمكن بعد ذلك حساب هذا التحيز باستخدام أحد أدوات التأكيد الخوارزمية مثل خفض عتبة الموافقة على طلبات الأقليات.

لكن بلاتنر ونيلسون أثبتا أن إدخال تعديلات للتخفيف من هذا التحيز لم يكن له أي تأثير. ووجدا أن درجة 620 لمقدم الطلب من الأقلية كانت في الواقع تجسيداً ضعيفاً لجدارة الائتمان الخاصة به. ويرجع ذلك إلى أن الخطأ قد يحدث بالاتجاه المعاكس على حد سواء؛ فقد يكون الرقم 620 هو في الحقيقة 625 أو 615.

قد يبدو هذا الاختلاف طفيفاً، لكنه يلعب دوراً مهماً؛ فنظراً لأن عدم الدقة ينبع من التشويش الموجود في البيانات وليس من التحيز في طريقة استخدامها، فإنه لا يمكن إصلاحه عن طريق إنشاء خوارزميات أفضل.

تقول بلاتنر: "إنها حلقة ذاتية التغذية؛  إذ إننا نمنح قروضاً للأشخاص الخطأ ولن تتاح الفرصة لجزء كبير من السكان لتكوين البيانات اللازمة لمنحهم قرضاً في المستقبل".

بعد ذلك، حاول بلاتنر ونيلسون قياس حجم المشكلة؛ حيث قاموا ببناء محاكاة خاصة بهم لأداة التنبؤ الخاصة بأحد مقرضي الرهن العقاري وقدّروا ما كان سيحدث إذا تم عكس القرارات بشأن المتقدمين الذين كانت درجاتهم على الحد الفاصل بين القبول والرفض، والذين تم قبولهم أو رفضهم نتيجة للدرجات غير الدقيقة. للقيام بذلك، لجأ الباحثان إلى مجموعة متنوعة من الأساليب، مثل مقارنة حالات المتقدمين المرفوضين بأخرى مماثلة تم قبولها، أو النظر في خطوط الائتمان الأخرى التي حصل عليها المتقدمون المرفوضون مثل قروض السيارات.

بتجميع كل هذا معاً، قاموا بإدخال قرارات القروض الافتراضية "الدقيقة" هذه إلى محاكاتهم وقياس الفرق بين المجموعات مرة أخرى. ووجدوا أنه عند افتراض أن القرارات المتعلقة بمقدمي الطلبات من الأقليات وذوي الدخل المنخفض كانت بنفس دقة تلك الخاصة بالأثرياء من ذوي البشرة البيضاء، انخفض التمييز بين المجموعات بنسبة 50%. بالنسبة لمقدمي الطلبات من الأقليات، جاء ما يقرب من نصف هذا التحسن بفضل إزالة الأخطاء حيثما كان يجب أن تتم الموافقة على مقدم الطلب ولكنه رُفض. شهد المتقدمون ذوو الدخل المنخفض تحسناً أقل؛ لأن إزالة الأخطاء لعبت دوراً في الاتجاه المعاكس خفف من هذا التحسن، أي المتقدمون الذين كان ينبغي رفضهم ولكنهم حصلوا على الموافقة.

تشير بلاتنر إلى أن فائدة معالجة عدم الدقة هذه لن تقتصر على مقدمي الطلبات من المحرومين فحسب، وإنما ستشمل المقرضين أيضاً. وتقول: "يسمح لنا النهج الاقتصادي بتحديد تكاليف الخوارزميات المشوشة بطريقة ذات مغزى؛ إذ يتيح لنا تقدير حجم سوء تخصيص الائتمان الناجم عن هذا التشويش".

تصحيح الأخطاء

لكن حل هذه المشكلة لن يكون سهلاً. تقول رشيدة ريتشاردسون، المحامية والباحثة التي تدرس التكنولوجيا والعرق في جامعة نورث إيسترن، إن هناك العديد من الأسباب التي تجعل البيانات الائتمانية الخاصة بمجموعات الأقليات مشوشة. وتضيف: "هناك عواقب اجتماعية معقدة حيث قد لا تسعى مجتمعات معينة إلى الحصول على الائتمان التقليدي بسبب عدم الثقة في المؤسسات المصرفية". يجب أن يتعامل أي إصلاح مع الجذور العميقة للمشكلة؛ إذ إن عكس الضرر الممتد على مدى أجيال يستدعي تطبيق مجموعة واسعة من الحلول والإصلاحات بما في ذلك اللوائح المصرفية الجديدة والاستثمار في مجتمعات الأقليات، وتوضح ريتشاردسون: "إن إيجاد الحلول ليس عملية سهلة؛ لأنها ينبغي أن تعالج العديد من السياسات والممارسات السيئة المختلفة".

قد يتمثل أحد الخيارات على المدى القصير في أن تدفع الحكومة المقرضين ببساطة إلى قبول مخاطر منح قروض لمقدمي الطلبات من الأقليات الذين ترفضهم خوارزمياتهم. سيسمح هذا للمقرضين بالبدء في جمع بيانات دقيقة حول هذه المجموعات لأول مرة؛ ما سيعود بالفائدة على المدى الطويل لكل من المتقدمين والمقرضين.

لقد بدأ عدد قليل من المقرضين الصغار في القيام بذلك بالفعل، كما تقول بلاتنر: "إذا كانت البيانات الحالية لا توفر لك الكثير من الفائدة، فقم بتقديم مجموعة قروض وتعلم المزيد من المعلومات حول الأشخاص". كما يرى رامباشان وريتشاردسون أن ذلك يمثل خطوة أولى ضرورية. لكن رامباشان يعتقد أن الأمر سيتطلب تحولاً ثقافياً في عقلية المقرضين الأكبر. ويقول إن الفكرة منطقية للغاية بالنسبة إلى مجتمع علوم البيانات. ومع ذلك، عندما يتحدث إلى تلك الفرق داخل البنوك، فإنهم يعترفون بأن وجهة النظر هذه لا تنال تأييداً واسعاً. ويقول: "سوف يتنهدون ويقولون إنه لا توجد طريقة يمكنهم من خلالها شرح ذلك لفريق العمل، وأنا لا أعلم ما الحل المناسب لهذه المسألة".

تعتقد بلاتنر أيضاً أنه يجب استكمال درجات الائتمان ببيانات أخرى حول المتقدمين مثل المعاملات المصرفية. وهي ترحب بالإعلان الأخير الصادر عن عدد قليل من البنوك، بما في ذلك جي بي مورجان تشايس (JPMorgan Chase)، بأنهم سيبدؤون بمشاركة البيانات حول الحسابات المصرفية لعملائهم كمصدر إضافي للمعلومات حول الأفراد من أصحاب التاريخ الائتماني الضعيف. ولكن ستكون هناك حاجة إلى إجراء مزيد من البحث لمعرفة الفرق الذي سيحدثه ذلك على أرض الواقع. وسيتوجب على الهيئات الرقابية ضمان أن زيادة الوصول إلى الائتمان لا يرافقه سلوك جشع في الإقراض، كما تقول ريتشاردسون.

ترى بلاتنر أن الكثير من الناس يدركون الآن مشاكل الخوارزميات المتحيزة. وهي ترغب في أن يبدأ الناس بمناقشة الخوارزميات المشوشة أيضاً. فالتركيز على التحيز -والاعتقاد بإمكانية إصلاحه تقنياً- يعني أن الباحثين ربما يغفلون عن المشكلة الأكبر.

تخشى ريتشاردسون أن يتم إقناع صانعي السياسات بأن التكنولوجيا يمكن أن تحمل الإجابات عندما لا يكون ذلك واقع الحال. وتختم بالقول: "البيانات غير المكتملة تثير القلق؛ لأن اكتشافها سيتطلب من الباحثين أن يمتلكوا فهماً دقيقاً إلى حد ما لأوجه عدم المساواة المجتمعية. إذا أردنا أن نعيش في مجتمع منصف يشعر فيه الجميع بالانتماء ويعامَلون بكرامة واحترام، فعلينا أن نبدأ بإدراك واقعي حول خطورة ونطاق القضايا التي نواجهها".

المحتوى محمي