مسابقة للرؤية الآلية تسعى لتحسين تحليل صور الأقمار الصناعية للأرض

2 دقائق

أحدثت تقنية الرؤية الآلية تغيراً جذرياً في طريقة رؤيتنا للعالم، فصارت الآلات تتفوق على البشر في أداء مهام مثل التعرف على الأوجه والكثير من أنواع التعرف على الأشياء، وتستخدم هذه التقنية حالياً في عدد كبير من التطبيقات بدءاً من أنظمة الأمن وحتى المركبات ذاتية القيادة.

لكن هناك مجالات لم تحدث فيها تقنيات الرؤية الآلية مثل هذا التأثير القوي لعل أبرزها تحليل صور الأقمار الصناعية للأرض.

وهذا من شأنه أن يمثل مفاجأة لأن الصور الملتقطة بالأقمار الصناعية كثيرة ومتسقة نسبياً في طريقة التقاطها، ومليئة بالبيانات المتنوعة، فهي مناسبة للغاية للآلات لتتعرف عليها، ومع ذلك، فإن تحليل صور الأقمار الصناعية غالباً ما يجريه خبراء بشريين مدربين على التعرف على الأشياء الواضحة نسبياً مثل الطرق والمباني والطريقة التي تستخدم بها الأرض.

لكن يبدو أن الأمر على وشك التغيير بفضل تحدي DeepGlobe للأقمار الصناعية الذي عقده باحثون في فيسبوك وشركة  DigitalGlobe(ديجيتال جلوب) لصور الأقمار الصناعية وشركاء أكاديميين من معهد ماساتشوستس للتكنولوجيا وجامعات أخرى. كان الهدف من المسابقة هو استخدام المشاركين لتقنيات الرؤية الآلية لأتمتة عملية تحليل صور الأقمار الصناعية، ومن المقرر الإعلان عن نتائج المسابقة الشهر المقبل. 

وقد دعا منظمو المسابقة المشاركين لابتكار طرق جديدة للتعرف التلقائي على ثلاثة أنواع من المعلومات في صور الأقمار الصناعية: شبكات الطرق والمباني واستعمال الأراضي، لذا تمثلت المهمة الطلوبة في التقاط صورة كمدخل وإنتاج مخرج واحد مما يلي: قناع يظهر شبكة الطرق؛ أو مجموعة متراكبة من المضلعات ترمز للمباني؛ أو خريطة مرمزة بالألوان تبين كيفية استخدام الأرض في الزراعة والحياة الحضرية والغابات وما إلى ذلك.

أنشأ الباحثون لكل مهمة من هذه المهام الثلاث، قاعدة بيانات للصور المزودة بتعليقات للمشاركين لاستخدامها في تدريب نظم الرؤية الآلية الخاصة بهم، وسيجري تقييم المتسابقين لاحقاً بحسب جودة أداء أنظمتهم في قاعدة بيانات تجريبية.

تتسم مجموعات البيانات بالشمول، إذ تتضمن مجموعة بيانات تحديد الطرق حوالي 9000 صورة باستبانة أرضية تبلغ 50 سم وتغطي مساحة إجمالية تزيد عن 2000 كيلومتر مربع في تايلاند وإندونيسيا والهند، وتشمل الصور المناطق الحضرية والريفية مع الطرق المعبدة وغير الممهدة، وتتضمن مجموعة بيانات التدريب أيضاً قناعاً لكل صورة تخص شبكة الطرق في تلك المنطقة.

تحتوي مجموعة بيانات المباني فتحتوي على أكثر من 24000 صورة، تعرض كل منها مساحة 200 متر مربع في لاس فيجاس أو باريس أو الخرطوم أو شنغهاي، وقد جرى تصوير أكثر من  300000 مبنى في مجموعة بيانات التدريب، وجرى تمييز كل منها من قبل خبراء بشريين بمضلع متراكب.

أما مجموعة بيانات استخدام الأراضي فتضم أكثر من 1000 صورة RGB (أو بالألوان الحقيقية) باستبانة 50 سنتيمتر، ومعها قناع يوضح استخدام الأراضي وفقاً لخبراء بشريين، وتشمل التسميات فئات: حضرية، وزراعية، ومراعي، وغابات ومياه، وجرداء، ومجهولة (أي مغطاة بالسحب).

وقد وضع منظمو مسابقة DeepGlobe عدداً من الخوارزميات لقياس دقة البيانات المولدة آلياً التي يمكن استخدامها لتقييم جميع المشاركين. وقد سجل في المسابقة 950 فريقاً، وسيُعلن عن الفائزين في مؤتمر في مدينة سولت ليك سيتي في 18 يونيو.

يبدو أن هذه المسابقة قد تجني الكثير من الثمار، ولعل أكبر المستفيدين هم قاطنو المناطق النائية التي لم تخطط شبكات الطرق فيها حتى هذه اللحظة. ويبرز بين رعاة المسابقة شركة أوبر، التي قد تتمكن من استخدام هذا النوع من البيانات في توسيع نطاق خدماتها. كما يفيد تحليل صور الأقمار الصناعية آلياً في حلالات وقوع الكوارث الطبيعية ولزوم وصول خدمات الطوارئ إلى المناطق المنكوبة على وجه السرعة. وبالإضافة إلى ذلك، إذا أتيحت البيانات على نطاق واسع بتكلفة منخفضة، فإنها ستفيد بحوث تغير المناخ والتخطيط الحضري.

ينبغي أن تكون هذه مجرد بداية؛ فهذا النوع من التحليل بالتأكيد لا يمثل سوى نقطة انطلاق لفهم أكثر تفصيلاً للعالم من حولنا، وسيكون من المثير للاهتمام التعرف على نتائج أداء المشاركين.

المرجع: arxiv.org/abs/1805.06561 : DeepGlobe 2018: A Challenge to Parse the Earth through Satellite Images

المحتوى محمي