ما هي الشبكات العصبونية الكبسولية؟
هي نوع من الشبكات العصبونية الاصطناعية تكرر الشبكة العصبونية البيولوجية من أجل تجزئتها والتعرف عليها بشكلٍ أفضل.
كيف تعمل الشبكات العصبونية الكبسولية؟
تعمل الشبكات العصبونية الكبسولية من خلال عدة خطوات وهي:
- تبدأ طبقة الكبسولات الأولى بضرب مصفوفة متجهات الإدخال بمصفوفات الوزن لاستخراج مجموعة من خرائط الميزات.
- يتم تحديد كبسولات الوالدين، ويتم اختيار الكبسولة الأم باستخدام خوارزمية التوجيه الديناميكي.
- يستمر العمل في ضغط المتجهات التي تقع بين 0 و1 مع الاحتفاظ باتجاهها بعد اتخاذ قرار كبسولات الوالدين.
- يتم جمع المزايا باستخدام مسافة جيب التمام (cosine) كمقياس للمطابقة.
مكونات الشبكات العصبونية الكبسولية
تحتوي الشبكات العصبونية الكبسولية على أربعة مكونات رئيسية للقيام بمهمتها:
- ضرب المصفوفة: يتم إجراء هذه العملية على طبقة الإدخال. نأخذ صورة نريد تحويلها إلى قيم متجهة لفهمها حاسوبياً.
- الترجيح العددي للمدخلات: تساعد أوزان المدخلات على تحديد الاتجاه الذي يجب أن تتجه فيه الكبسولات الحالية في الطبقة التالية ويعمل على التوازي مع المكون الثالث.
- خوارزمية التوجيه الديناميكية: يتم تحقيق قوة الشبكات العصبونية الكبسولية من خلال خوارزمية التوجيه الديناميكي والتي تعمل على تسهيل الاتصال بين الكبسولة الأولية وطبقة (DigitCaps)، وهي الطبقة الأعلى مستوى. تحتاج الكبسولة (i) في طبقة الكبسولة الأولية (الطبقة السفلية) إلى معرفة كيفية إرسال متجه إخراجها إلى طبقة المستوى الأعلى (DigitCaps).
- تطبيق وظيفة غير خطية لتكثيف المعلومات: على عكس الشبكات العصبونية الالتفافية، حيث نستخدم دالة خطية ReLU، هنا نستخدم دالة الاسكواش (غير الخطية) والتي تقوم بتكثيف المعلومات وضغطها إلى طول يتراوح بين 0 و1.
تطبيقات الشبكات العصبونية الكبسولية
أحد التطبيقات الشائعة للشبكات العصبونية الكبسولية هو التعرف على الصور، حيث ثبت أن الشبكات العصبونية الكبسولية تتفوق على الشبكات العصبونية التلافيفية التقليدية، إضافة لتطبيقها في معالجة اللغات الطبيعية إذ تستطيع الشبكات العصبونية الكبسولية أن تتعرف بشكلٍ أفضل على العلاقات بين الكلمات والمفاهيم والربط بينها.