أنثروبيك تطور نموذجاً ذكياً يستطيع تنفيذ مهام طويلة

3 دقيقة
ما أبرز مهام مهندس البيانات الضخمة في الشركة؟
حقوق الصورة: shutterstock.com/ everything possible

أعلنت شركة أنثروبيك عن نموذجين جديدين للذكاء الاصطناعي تزعم أنهما يمثلان خطوة كبيرة نحو جعل منظومات الذكاء الاصطناعي الوكيلة مفيدة حقاً.

تقول الشركة إن منظومات الذكاء الاصطناعي الوكيلة المدربة على كلاود أوبوس 4، وهو أقوى نماذج الشركة حتى الآن، ترفع مستوى قدرات هذه الأنظمة من خلال معالجة المهام الصعبة على مدى فترات زمنية طويلة والاستجابة لتعليمات المستخدم على نحو أكثر فائدة.

اقرأ أيضاً: شركة أنثروبيك تطوّر «درعاً» لحماية أنظمة الذكاء الاصطناعي من التلاعب والاختراق

كلاود أوبوس 4

جرى تصميم كلاود أوبوس 4 لتنفيذ المهام المعقدة التي تنطوي على إنجاز آلاف الخطوات على مدار عدة ساعات. فعلى سبيل المثال، أنشأ دليلاً للعبة الفيديو بوكيمون ريد في أثناء لعبها أكثر من 24 ساعة متواصلة. تقول مسؤولة المنتجات للأغراض البحثية في أنثروبيك، ديان بين، إن النموذج الأقوى السابق للشركة، كلاود 3.7 سونيت، كان قادراً على اللعب مدة 45 دقيقة فقط.

وبالمثل، تقول الشركة إن أحد عملائها، وهو شركة التكنولوجيا اليابانية راكوتين، استخدم مؤخراً نسخة من كلاود أوبوس 4 كي تتولى مهمة البرمجة بصورة مستقلة مدة تقارب سبع ساعات في مشروع معقد مفتوح المصدر.

وقد أحرزت أنثروبيك هذا التقدم من خلال تحسين قدرة النموذج على إنشاء "ملفات الذاكرة" والاحتفاظ بها لتخزين المعلومات الأساسية. هذه القدرة المحسنة على "التذكر" تجعل النموذج أفضل في إكمال المهام الأطول.

من المساعد إلى المنظومة الوكيلة الحقيقية

يقول بن: "نحن نعتبر هذه القفزة في جيل النموذج بمثابة الانتقال من دور المساعد إلى دور المنظومة الوكيلة الحقيقية. في حين لا يزال يتعين عليك تقديم الكثير من الملاحظات الفورية واتخاذ القرارات الرئيسية كلها لمساعدات الذكاء الاصطناعي، يمكن للمنظومة الوكيلة اتخاذ هذه القرارات الرئيسية بنفسها. وهذا يسمح للبشر بأن يؤدوا دور المفوض أو القاضي، بدلاً من الاضطرار إلى توجيه هذه الأنظمة في كل خطوة".

في حين أن كلاود أوبوس 4 سيقتصر على عملاء أنثروبيك الذين لديهم الاشتراكات المدفوعة، ثمة نموذج ثانٍ، وهو كلاود سونيت 4، سيكون متاحاً للمستخدمين من كلا نوعي الاشتراك، المدفوع والمجاني. يجري تسويق أوبوس 4 على أنه نموذج قوي وكبير الحجم للتعامل مع التحديات المعقدة، بينما يوصف سونيت 4 بأنه نموذج ذكي وفعال للاستخدام اليومي.

 اقرأ أيضاً: لماذا لا يوجد تعريف واضح لوكلاء الذكاء الاصطناعي حتى الآن؟

كلا النموذجين الجديدين هجينان، ما يعني أنهما يمكنهما تقديم إجابة سريعة أو إجابة مبنية على مستوى أعمق من التفكير المنطقي حسب طبيعة الطلب. وبينما يجري النموذجان العمليات الحسابية اللازمة للعثور على  الإجابة، يمكن لكل منهما البحث عبر الإنترنت أو استخدام أدوات أخرى لتحسين مخرجاتهما.

يقول مدير قسم الذكاء الاصطناعي في شركة ديب فلو الناشئة والمؤلف المشارك لكتاب " التعلم المعزز ذو المنظومات الوكيلة المتعددة: الأسس والنهج الحديثة"، ستيفانو ألبريشت، إن شركات الذكاء الاصطناعي تخوض حالياً سباقاً لابتكار منظومات ذكاء اصطناعي وكيلة مفيدة حقاً وقادرة على التخطيط للمهام المعقدة والتفكير فيها وتنفيذها بصورة موثوقة ودون إشراف بشري. وغالباً ما يتضمن ذلك استخدام الإنترنت أو أدوات أخرى بصورة مستقلة. لا تزال هناك عقبات تتعلق بالسلامة والأمن يجب التغلب عليها. فمنظومات الذكاء الاصطناعي الوكيلة المدعومة بنماذج لغوية كبيرة يمكن أن تتصرف بطريقة عشوائية وتنفذ أفعالاً غير مقصودة، وهذا ما يفاقم حجم المشكلة عند الوثوق بها للعمل دون إشراف بشري.

مشاكل السلامة

ويقول ألبريشت: "كلما زادت قدرة المنظومات الوكيلة على إنجاز المهمات على مدى فترات زمنية طويلة، زادت فائدتها، لا سيما إذا اقترن ذلك بتراجع الحاجة إلى تدخلي أكثر فأكثر. إن قدرة النماذج الجديدة على استخدام الأدوات على التوازي أمر مثير للاهتمام، إذ قد يوفر ذلك بعض الوقت خلال تنفيذ المهام، لذا سيكون ذلك مفيداً".

من الأمثلة على أنواع مشاكل السلامة التي لا تزال شركات الذكاء الاصطناعي تعالجها، يمكن أن ينتهي الأمر بالمنظومات الوكيلة إلى اتخاذ طرق مختصرة غير متوقعة أو استغلال الثغرات لتحقيق الأهداف التي أعطيت لها. على سبيل المثال، قد تلجأ إلى حجز المقاعد المتاحة كلها على متن طائرة لضمان حصول مستخدمها على مقعد، أو قد تلجأ إلى أساليب الغش الإبداعية للفوز في لعبة الشطرنج. تقول أنثروبيك إنها تمكنت من الحد من هذا السلوك، المعروف باسم "اختراق المكافآت"، في كلا النموذجين الجديدين بنسبة 65% مقارنة بكلاود سونيت 3.7، وقد حققت ذلك من خلال مراقبة السلوكيات الإشكالية من كثب في أثناء التدريب، وتحسين كل من بيئة تدريب الذكاء الاصطناعي وأساليب التقييم.

المحتوى محمي