في منتصف شهر فبراير/شباط الماضي أعلنت شركة أوبن أيه آي، نموذج ذكاء اصطناعي جديداً لإنشاء مقاطع فيديو واقعية للغاية عبر المطالبات النصية يُسمَّى سورا (Sora)، في توجه بارز للشركة لاستكشاف ودمج تكنولوجيا نموذجها اللغوي جي بي تي في منتجات أخرى، بعيداً عن بوت الدردشة المدعوم بتكنولوجيا الذكاء الاصطناعي التوليدي تشات جي بي تي.
وهو ما ظهر في الإعلان الأخير، حيث كشفت شركة صناعة الروبوتات الناشئة فيغر أيه آي (Figure AI) التي تقيم شراكة مع شركة أوبن أيه آي، عن روبوت بشري متطور من شأنه أن يُعيد تعريف حدود التفاعل بين الإنسان والروبوت، حيث أظهر الروبوت إمكانات مذهلة وسرعة جيدة في الردود على الأسئلة والإجراءات الجسدية بطريقة لم تُشهد من قبل في الروبوتات.
إحداث ثورة في التفاعل بين الإنسان والروبوت
يجسد الروبوت المُسمّى فيغر زيرو ون (Figure 01) الذي يبلغ طوله نحو متر ونصف ويزن 132 نحو 59 كيلوغراماً والذي طُوِّر بشكلٍ مشترك من قِبل شركتي فيغر (Figure) وشركة أوبن أيه آي، مثالاً للروبوتات البشرية المتطورة بالاستفادة من قوة نموذج اللغة الكبير الذي تطوّره شركة أوبن أيه آي في قدرته على الانخراط في محادثات سلسة مع البشر.
اقرأ أيضاً: روبوتات شبيهة بالبشر غيّرت العالم
ففي عرض توضيحي، أظهر الروبوت البشري براعته من خلال تحديد الأشياء الموضوعة أمامه دون عناء والرد على الاستفسارات في الوقت الفعلي وتقديم سبب قيامه بأفعاله بسهولة، وهو ما يمثّل طريقة عملية لسد الفجوة بين فهم اللغة والتنفيذ المادي في مجال الروبوتات البشرية (Humanoid Robots).
ويأتي الانبهار الكبير بالروبوت البشري فيغر زيرو ون من قدرته على الجمع بين تكنولوجيا الشبكات العصبونية وخوارزميات الذكاء الاصطناعي المتقدمة، ما مكّنه من تقديم ردوده والتعبير شفهياً بسهولة، وبحسب الخبراء فإن هذا الدمج للقدرات المعرفية من شأنه أن يبشّر بعصر جديد في مجال الروبوتات حيث تندمج الآلات بسلاسة في البيئات البشرية.
اقرأ أيضاً: ما هي الروبوتات اللينة وكيف تستفيد البشرية منها؟
قفزة إلى الأمام في التكامل بين الذكاء الاصطناعي والروبوتات البشرية
على عكس الروبوتات البشرية التقليدية، يتجاوز الروبوت فيغر زيرو ون المهام المادية المجردة ويتعمق في عوالم التفكير وصنع القرار، ما جعله في موقع متقدم مقارنة بالروبوتات الأخرى المدعومة بالذكاء الاصطناعي. فعلى عكس العروض التوضيحية لباقي الروبوتات الأخرى التي غالباً ما اعتمدت على التشغيل عن بُعد أو السيناريوهات المرحلية، يبرز الروبوت فيغر زيرو ون استقلاليته الكاملة وقدراته المعرفية.
ومن ثَمَّ فإن قدرته على الانخراط في محادثات دقيقة في أثناء تنفيذ المهام بالوقت الفعلي يضع معياراً جديداً للروبوتات البشرية، ما يشير إلى تحول نحو الروبوتات البشرية التي تندمج بسلاسة في مختلف جوانب الحياة البشرية؛ من المساعدة في المهام اليومية إلى المساهمة في صناعات مثل الرعاية الصحية والتصنيع والضيافة، وهو ما من شأنه أن يمهّد الطريق لمستقبل يتعاون فيه الإنسان والآلة بشكلٍ متناغم.
اقرأ أيضاً: شاومي وتسلا تنقلان سباق الروبوتات الشبيهة بالبشر إلى مستوى جديد
ثورة في التفاعل في الوقت الفعلي بين الإنسان والروبوت
بحسب شركة صناعة الروبوتات الناشئة، فإن الروبوت فيغر زيرو ون يعمل عبر تحويل الكلام إلى كلام (Speech to Speech) باستخدام نموذج اللغة المرئية (Visual Language Model، اختصاراً في إل إم VLM) الذي طُوِّر بجهدٍ مشترك مع شركة أوبن أيه آي، حيث يساعد النموذج على فهم الصور والنصوص ويعتمد على محادثة صوتية كاملة لصياغة ردوده، ما يجعله مختلفاً عن نموذج جي بي تي الذي يركّز على المطالبات المكتوبة.
علاوة على ذلك ووفقاً لشركة الروبوتات، فإن نماذج شركة أوبن أيه آي توفّر ذكاءً اصطناعياً مرئياً ولغوياً عالي المستوى، بينما توفّر شبكاتها العصبونية الخاصة التي تطورها عمليات روبوتية سريعة ومتناغمة، وهذا ما ظهر في المقطع التوضيحي، حيث أكدت الشركة أن كل سلوك أظهره الروبوت يعتمد على تعلم النظام ولا يُشغل عن بُعد، ما يعني أنه لا يوجد أحد وراء الكواليس يحرك الروبوت أو يتحكم به.
كما ذكر مؤسس شركة الروبوتات الناشئة بريت أدكوك (Brett Adcock) أن الروبوت فيغر زيرو ون لديه كاميرات تغذّي بيانات نموذج اللغة المرئية التي تساعده على فهم المشهد أمامه، ما يسمح له بالتفاعل بسلاسة مع الإنسان وفهم متطلباته والإجابة أو إبداء الحركات الجسدية وفقاً لذلك.
اقرأ أيضاً: روبوت مستوحى من فن الكريغامي الياباني قد يُحدث ثورة في صناعة الأطراف الروبوتية
فصل جديد من المنافسة بين شركات تصنيع الروبوتات البشرية
نظراً إلى أن الروبوت فيغر زيرو ون قد أبدى قدرات متطورة للغاية بحسب الفيديو التوضيحي، فإنه بلا شك سيدخل حلبة المنافسة بقوة مع شركات صناعة الروبوتات البشرية الكبرى مثل تيسلا (Tesla) وبوسطن دايناميك (Boston Dynamics)، اللتين أعلنتا سابقاً عن العديد من نماذج الروبوتات البشرية التي تؤدي العديد من الحركات الرياضية والراقصة، ومع ذلك لم تعلن كلتا الشركتين عن روبوت يمكنه التفاعل مع الإنسان بسلاسة مثل الشركة الناشئة فيغر.
فعلى الرغم من أن روبوت أوبتيموس (Optimus) الذي تطوّره شركة تيسلا المملوكة لرائد الأعمال إيلون ماسك يمكنه التجول والتقاط بيضة وحتى طي الغسيل، فإنه اكتُشِف لاحقاً أن الروبوت لا يتصرف ذاتياً بل يستخدم تقنية قديمة تُسمَّى المناور عن بُعد (Remote Manipulator) تُتيح لمشغل بشري التحكم في الروبوت، وهذا يعني أن المشغل البشري ينفذ أولاً الحركة ثم يقلده الروبوت لاحقاً.
اقرأ أيضاً: محاكاة أشكال الحيوانات وسلوكها تساعدنا على تطوير روبوتات أفضل
وهذا هو السبب الذي جعل معظم موظفي شركة فيغر تقريباً، وعلى رأسهم المؤسس المشارك والعديد من الباحثين في الشركة، يؤكدون في تغريداتهم على منصة إكس أن الروبوت فيغور زيرو ون لا يستخدم أي خدع عند عمله ولا يوجد أي تقنيات تتحكم به عن بُعد أو تُملى عليه ما ينبغي عليه عمله أولاً.
جدير بالذكر أن شركة فيغر أيه آي (Figure AI) قد تأسست عام 2022 وتعمل على إنتاج الروبوتات المدعومة بالذكاء الاصطناعي بغرض استخدامها في القطاعات التي تواجه نقصاً في العمال بشكل حاد، مثل التصنيع والشحن والخدمات اللوجستية والتخزين والبيع بالتجزئة.
وقد جمعت الشركة مؤخراً تمويلاً وصل إلى 675 مليون دولار أوصل قيمتها إلى 2.6 مليار دولار، والهدف النهائي للشركة هو تطوير روبوتات بشرية قادرة على أداء المهام اليومية بشكل ذاتي التحكم، ما يتطلب منها تطوير أنظمة ذكاء اصطناعي أكثر قوة، وفي الوقت نفسه تُعدُّ الشركة الناشئة واحدة من عدة شركات تتنافس لجعل الروبوتات البشرية حقيقة واقعة في سوق من المتوقع أن تصل قيمتها إلى 38 مليار دولار بحلول عام 2035.