طوّر باحثون طريقة جديدة لمساعدة الذكاء الاصطناعي على استخراج المعلومات الثلاثية الأبعاد من الصور الثنائية الأبعاد، ما يجعل الكاميرات أكثر فائدة لهذه التقنيات الناشئة. الطريقة الجديدة يمكن أن تكون مفيدة خصوصاً في تطبيقات السيارات الذاتية القيادة لمساعدتها على التنقل في مساحة ثلاثية الأبعاد باستخدام الصور الثنائية الأبعاد.
وذلك لأن الكاميرات أقل تكلفة من الأدوات الأخرى المستخدمة للتنقل في المساحات الثلاثية الأبعاد، مثل تكنولوجيا الليدار (LiDAR) التي تعتمد على الليزر لقياس المسافة، والتي تعتبر مكلفة بالنظر إلى الكاميرات التي يمكن استخدامها في هذه الطريقة، حيث يمكن لمصممي السيارات ذاتية القيادة تثبيت كاميرات متعددة وبناء التكرار في النظام.
التكنولوجيات الحالية جيدة ولكنها ليست بما يكفي
باعتبارها تمثيلات ثنائية الأبعاد لعالم ثلاثي الأبعاد، تفتقد الصور قدراً هائلاً من المعلومات حول الأحجام الفعلية للأشياء التي تصورها، بالإضافة إلى بُعدها عن الكاميرا (وبعضها بعضاً). تؤدي هذه المشكلات المتعلقة بالعمق والمنظور في بعض الأحيان إلى ظهور أوهام بصرية غريبة وممتعة.
ولكنها تصبح مشكلة خطيرة إذا كنت بحاجة إلى التنقل في العالم الحقيقي باستخدام كاميرات ثنائية الأبعاد، ودون وجود خريطة ثلاثية الأبعاد موثوقة للمناطق المحيطة بها، فإن البرامج التي تقود السيارات تكون عرضة لارتكاب الأخطاء، وحتى الآن كان هذا أحد العوائق الرئيسية أمام التبني الواسع النطاق لتكنولوجيا السيارات الذاتية القيادة.
اقرأ أيضاً: لا تغضب كالبشر ولا ترى في المطر: هذه مزايا السيارات الذاتية القيادة وعيوبها
وتتضمن إحدى التكنولوجيات الأكثر استخداماً للتغلب على المشكلة دمج الصور مع تكنولوجيا ليدار (LiDAR) التي تبني خرائط ثلاثية الأبعاد عن طريق إرسال أشعة الليزر في اتجاهات متعددة، وقياس المدة التي يستغرقها الضوء للارتداد عن الأشياء المحيطة، ومع ذلك فإن هذه التكنولوجيا مكلفة، وقد يكون من الصعب دمج الأجهزة مع تصميمات السيارات الحديثة.
حل ذكي لاستخراج المعلومات ثلاثية الأبعاد مباشرة من الصور الثنائية الأبعاد
طوّر فريقٌ من الباحثين بقيادة الأستاذ المشارك لهندسة الكهرباء والكمبيوتر في جامعة نور كارولينا شيانبينغ ليو (Xianpeng Liu) طريقة حل أكثر ذكاءً، أُطلق عليها اسم مونو إكسيفير (MonoXiver) مدعومة بالذكاء الاصطناعي لاستخراج المعلومات الثلاثية الأبعاد مباشرة من الصور الثنائية الأبعاد، وقد تمت مراجعتها من قِبل الأقران في 3 أبريل/ نيسان 2023.
ويبدأ نهج مونو إكسيفير متعدد الخطوات بكاميرا أحادية بسيطة وجاهزة للاستخدام، حيث تستخدم هذه الأجهزة عدسة واحدة لتقدير الأشكال الهندسية الثلاثية الأبعاد تقريباً من الصور ثنائية الأبعاد استناداً إلى إشارات الصورة، بما في ذلك التظليل والإضاءة والأنماط والملمس والأحجام الظاهرية للأشياء المتشابهة المظهر.
اقرأ أيضاً: كيف يمكن أن تكون السيارات الذاتية القيادة أكثر أماناً على الطريق؟
وبناءً على هذه التقديرات، يحدد نهج مونو إكسيفير بعد ذلك الأشياء المهمة في الصورة ويحيطها -مثل السيارات في الشارع- باستخدام مربع محيط افتراضي ثلاثي الأبعاد، حيث تساعد المربعات على تصور المقاييس المختلفة ونسب العرض إلى الارتفاع والاتجاهات للكائنات الثلاثية الأبعاد في المشهد.
في البداية، تعتمد مواضع المربعات المحيطة هذه على التقديرات الأولية للكاميرا الأحادية، ولكن باستخدامها كنقطة بداية يقوم مونو إكسيفير بإعادة تحليل المنطقة الموجودة بداخلها، وإنشاء مجموعة ثانوية من الصناديق الأصغر حجماً، والتي تلتقط العديد من التفاصيل الأصغر التي لم تتم الإشارة إليها في المربع الأولي.
وباستخدام نماذج متخصصة يستطيع مونو إكسيفير أيضاً تحديد متى تتداخل هذه التفاصيل الصغيرة، والتمييز بينها عندما تكون مزدحمة أو قريبة من بعضها بعضاً. علاوة على ذلك، يمكن باستخدام هذه الطريقة أخذ العينات من أعلى إلى أسفل، أي إنشاء الصناديق المحيطة الثانوية بكفاءة عالية للغاية وتحليلها.
اقرأ أيضاً: أحدث التطورات في تكنولوجيا السيارات ذاتية القيادة: القدرة على رؤية ما هو قادم حتى حول الزوايا
القدرة على تحسين تنقل السيارات الذاتية القيادة
وللتأكد من أن دقة طريقة مونو إكسيفير تتطابق فعلاً مع الموجود في الصور الثنائية الأبعاد، فقد اختبرها فريق البحث باستخدام مجموعتين من الصور الثنائية الأبعاد، إحداهما مجموعة صور من شركة كيتي (Kitti) والأخرى مجموعة بيانات من شركة وايمو (Waymo) ثنائية الأبعاد.
وقد أثبتت الاختبارات قدرة نظام مونو إكسيفير على إنشاء خرائط دقيقة ثلاثية الأبعاد لمحيطه، وبناءً على هذا الأداء، يأمل فريق البحث في أن يؤدي نهجهم إلى تعزيز قدرة أنظمة الذكاء الاصطناعي في السيارات الذاتية القيادة على تحسين التنقل في الفضاء الثلاثي الأبعاد، وإيجاد طرق آمنة وفعّالة حتى في البيئات الحضرية المزدحمة.
علاوة على ذلك، فإن نظام مونو إكسيفير قابل للتكيُّف بدرجة كبيرة، ويقول الباحثون إنه يمكن تعديله بسهولة للعمل مع أي كاميرا أحادية، ما يجعله فأكثر تناولاً للمستخدمين العاديين من الأنظمة الأكثر تكلفة مثل ليدار.
اقرأ أيضاً: ما مستويات الاستقلالية في السيارات الذاتية القيادة؟ وما المستوى الذي وصلنا إليه الآن؟
بالإضافة إلى ذلك من الملاحظ في الطريقة الجديدة أنها غير مكلفة نسبياً. على سبيل المثال، يمكن أن يعمل النظام على معدل 55 إطاراً في الثانية، مع القدرة على الانخفاض إلى معدل 40 إطاراً في الثانية عند دمجه مع التقنيات الأخرى التي لا تزال سريعة بما يكفي في التطبيقات العملية.
جدير بالذكر أن النظام حتى الآن ليس مثالياً، فعند مواجهة صور أكثر صعوبة، مثل الظروف الغائمة والضبابية كان يفشل أحياناً، وفي الوقت الحالي يواصل الفريق اختبار نهجهم وضبطه بهدف تقريب تكنولوجيا مونو إكسيفير خطوة من الطرح التجاري.
ومع مزيد من التكيُّف يأملون أيضاً في إمكانية تطبيق نهج مماثل للذكاء الاصطناعي عبر مجموعة متنوعة من المجالات خارج نطاق السيارات الذاتية القيادة، مثل الروبوتات والواقع الافتراضي والمراقبة البيئية والتصوير الطبي.