رؤية آلية تستخدم طريقة البشر في التعرف على الأشياء

2 دقائق
مصدر الصورة: سباينوس نيتشر للتصوير/ ويكيبيديا؛ إم إس تك

تُشكِّل طريقة رؤية البشر للأشياء مصدرَ إلهام بالنسبة لخوارزميةٍ جديدة للتعرف على الصور.

السياق العام
عندما ننظر نحن البشرٍ إلى صورةٍ جديدة لشيءٍ ما، فإننا نحدِّد ماهيته بالاستناد إلى مجموعةٍ من السمات المعروفة. فعلى سبيل المثال، قد نحدد فصيلة أحد الطيور من خلال شكل منقاره ولون ريشه وشكل قدميه. أما الشبكة العصبونية -في المقابل- فتبحث ببساطةٍ عن أنماط توزع البيكسلات عبر الصورة بأكملها من دون التمييز بين الطائر الفعلي والخلفية المحيطة به. مما يجعلها أكثر عرضةً لارتكاب الأخطاء ويصعِّب على البشر تحليل طريقة عملها وتصحيح أخطائها.

كيف تعمل الخوارزمية الجديدة؟
عوضاً عن تدريب الشبكة العصبونية على صورٍ كاملة للطيور، قام الباحثون من جامعة ديوك ومخبر إم آي تي لينكولن بتدريبها على معرفة السمات المختلفة مثل شكل المنقار والرأس ولون الريش لكلِّ أنواع الطيور. وهكذا، عندما تفحص الخوارزمية صورةً جديدة لطائر، فإنها تبحث عن هذه السمات القابلة للتعرف وتَبْني توقعاتٍ حول الفصيلة التي ينتمي الطائر إليها؛ حيث تعتمد على تراكم الأدلة على وجود هذه السمات من أجل اتخاذ قرارها النهائي حول نوع الطائر.

مثالٌ على عمل الخوارزمية
عند فحص الخوارزمية لصورة نقّار الخشب أحمر البطن، فقد تجد سِمتين قابلتين للتعرف تدربت عليهما من قَبل، مثل نمط ريشه ذي اللونين الأبيض والأسود والتلوين الأحمر لرأسه. قد تتطابق السمة الأولى مع فصيلتين محتملتين من الطيور وهما نقّار الخشب أحمر البطن ونقّار الخشب أحمر الصدغَين، لكن السمة الثانية تحقق تطابقاً بشكل أفضل مع الفصيلة الأولى.

ومن خلال مراكمة هذين الدليلين، تقرر الخوارزمية منطقياً أن من المرجح أن تكون الصورة لطائرٍ من الفصيلة الأولى أي نقّار الخشب أحمر البطن. بعد ذلك تقوم بعرض صور السمات التي وجدتها لكي تشرح للمراقب البشري كيفية توصّلها إلى هذا القرار.

لماذا تُعتبر هذه الخوارزمية مهمةً؟
ينبغي أن تتمكن خوارزميات التعرف على الصور من شرح طريقة توصلها إلى قراراتها بطريقةٍ مفهومة بالنسبة للبشر لكي تصبح أكثر فائدةً في البيئات المعقدة والدقيقة كالمستشفيات، فقد تساعد طبيباً في تصنيف ورمٍ ما. وبالنسبة للبشر، فليس من المهم فقط الوثوق في قرارات هذه الخوارزميات، وإنما من الضروري أيضاً أن يتمكنوا بسهولةٍ من اكتشاف الحالات التي يكون منطق التوصُّل إلى هذه القرارات خاطئاً.

ومن خلال الاختبار، أظهر الباحثون أيضاً أن إدراج إمكانية التفسير هذه في خوارزميتهم لم يُضرَّ بدقتها؛ حيث إنه في كلٍّ من مهمتي التعرف على أنواع الطيور وعلى طرازات السيارات، وجد الباحثون أن طريقتهم قد حققت نتائجَ مقاربةً لنتائج أحدث الخوارزميات التي لا تتمتع بخاصية قابلية التفسير، بل حتى تفوَّقت عليها في بعض الحالات.