أعلنت أوبن أيه آي (OpenAI) عن النتائج الأولى التي توصل إليها فريق المواءمة الفائقة لديها، وهو يمثل المبادرة الداخلية التي أطلقتها الشركة لمنع الذكاء الاصطناعي الفائق -وهو حاسوب مستقبلي افتراضي يستطيع التفوق بذكائه على البشر- من الخروج عن السيطرة.
وعلى عكس الكثير من إعلانات الشركة الأخرى، لا يتضمن هذا الإعلان أي إنجازات غير مسبوقة. ففي ورقة بحثية نُشِرت بعيداً عن الضجيج الإعلامي، يصف الفريق تقنية تسمح للنماذج اللغوية الكبيرة الأقل قدرة بالإشراف على النماذج الأكثر قدرة، وتشير إلى أنها قد تكون خطوة صغيرة نحو إيجاد طريقة قد تتيح للبشر الإشراف على الآلات التي تتجاوزهم قدرة.
بعد مرور شهر تقريباً على الهزة العنيفة التي تعرضت لها أوبن أيه آي بسبب الأزمة التي نجمت عن طرد مجلس الرقابة الرئيسَ التنفيذي، سام ألتمان، (فيما يبدو أنه محاولة انقلابية بقيادة كبير العلماء إيليا ساتسكيفر) وإعادته إلى منصبه بعد ثلاثة أيام، قررت الشركة إرسال رسالة واضحة إلى الجميع: لقد عدنا إلى العمل كالمعتاد.
غير أن عمل أوبن أيه آي ليس معتاداً. فلا يزال الكثير من الباحثين يشككون في إمكانية وصول الآلات إلى مستوى الذكاء البشري على الإطلاق، فضلاً عن تجاوزه. لكن فريق أوبن أيه آي ينظر إلى تفوق الآلات بوصفه حدثاً حتمياً سنصل إليه في نهاية المطاف. يقول الباحث في فريق المواءمة الفائقة، ليوبولد أشينبرينر: "لقد تطور الذكاء الاصطناعي في السنوات القليلة الماضية بسرعة مذهلة. لقد حطمنا جميع الأرقام القياسية، وعلى الرغم من هذا، لا يزال التطور مستمراً بالوتيرة نفسها".
بالنسبة لأشينبرينر وغيره من الباحثين في الشركة، فإن النماذج التي تتمتع بقدرات تضاهي قدرات البشر ستصبح حقيقة واقعة قريباً جداً. يضيف أشينبرينر: "لكن التطور لن يتوقف عند هذا الحد. فسوف نتمكن من بناء نماذج أكثر قدرة من البشر، وتتسم بذكاء يفوق الذكاء البشري بكثير. وهو ما يعني ظهور تحديات تقنية جديدة وأساسية".
في يوليو/تموز، شكّل سوتسكيفير وزميله العالم في أوبن أيه آي، جان ليكي، فريق المواءمة الفائقة للتعامل مع هذه التحديات. وقد قال ساتسكيفر لإم آي تي تكنولوجي ريفيو في سبتمبر/أيلول: "لقد فعلت هذا مدفوعاً بمصلحتي الذاتية. من الواضح أن اتخاذ الإجراءات اللازمة لمنع خروج أي ذكاء اصطناعي خارق يبنيه البشر عن السيطرة مسألة مهمة. هذا أمر بديهي".
وفي خضم التكهنات التي تقول إن ألتمان طُرِد بسبب استعجاله الطائش واستخفافه بمسؤوليته عن مقاربة الشركة للأمان فيما يتعلق بالذكاء الاصطناعي، كان فريق التراصف الفائق الذي شكّله سوتسكيفير يعمل في صمت بعيداً عن الأضواء. كان الكثيرون ينتظرون لرؤية ما كان الفريق يعمل عليه بالضبط.
اقرأ أيضاً: ما حقيقة الضجيج الإعلامي حول اقتراب أوبن إيه آي من تطوير الذكاء الاصطناعي العام؟
مهام مطلوبة ومهام محظورة
يتلخص السؤال الذي كان الفريق يبحث عن إجابة له في كيفية لجم النماذج المستقبلية الافتراضية الأذكى منا بكثير والمعروفة باسم النماذج الخارقة (أي المتفوقة على البشر)، أو "مواءمتها". تعني المواءمة (أو فرض الانضباط) الحرص على التزام النموذج بتنفيذ المهام المطلوبة منه، والامتناع عن المهام المحظورة عليه. تطبق المواءمة الفائقة هذه الفكرة على النماذج الخارقة.
تُسمى إحدى أكثر التقنيات المستخدمة في مواءمة النماذج الحالية انتشاراً "التعلم المعزز من خلال التوجيه البشري". وباختصار، يمنح المشرفون البشر النقاط لإجابات النموذج، بحيث يمنحون نقاطاً أكثر للسلوك الذي يرغبون في تعزيزه، ويمنحون نقاطاً أقل للسلوك الذي يرغبون في منعه. وتُستخدم هذه المعلومات لتدريب النموذج على إنتاج الإجابات من النوع المرغوب لدى المشرفين البشر فقط. ويُعزى نجاح تشات جي بي تي (ChatGPT) وقدرته العالية على التفاعل، بنسبة كبيرة، إلى هذه التقنية.
اقرأ أيضاً: بسبب تشات جي بي تي: كبير علماء ميتا حذّر زوكربيرغ من نهاية فيسبوك وإنستغرام
لكن المشكلة تكمن في أن البشر يجب أن يكونوا قادرين على تحديد السلوكيات المطلوبة وغير المطلوبة في المقام الأول. من ناحية أخرى، تقول الفكرة إن النموذج الخارق قد يقدم نتائج لا يمكن للمشرف البشري استيعابها، ما يعني عجزه عن تقييمها ومنحها النقاط المناسبة. (وقد أخبرنا سوتسكيفير إنه قد يحاول حتى إخفاء سلوكه الحقيقي عن البشر).
يشير الباحثون إلى أن دراسة هذه المشكلة صعبة لأن الآلات الخارقة غير موجودة. ولهذا، استعاضوا عن عناصر هذه المشكلة بما يمثلها إلى حد ما. فبدلاً من دراسة كيفية إشراف البشر على الآلات الخارقة، درس الباحثون كيفية إشراف جي بي تي 2 (GPT-2)، وهو نموذج أطلقته أوبن أيه آي منذ خمس سنوات، على جي بي تي-4 (GPT-4)، وهو أحدث نماذج أوبن أيه آي وأكثرها قدرة. يقول باحث آخر في فريق المواءمة الفائقة، كولين برنز: "إذا أمكن تحقيق هذا الأمر، فقد يكون مؤشراً على إمكانية استخدام تقنيات مماثلة في إشراف البشر على النماذج الخارقة".
اقرأ أيضاً: 8 عوامل تخبرنا أن نموذج الذكاء الاصطناعي جي بي تي 4 لم يتفوق على الذكاء البشري
درّب الفريق نموذج جي بي تي 2 على تنفيذ مجموعة من المهام المختلفة، بما فيها مجموعة من أحاجي الشطرنج، و22 اختباراً شائعاً في مجال معالجة اللغة الطبيعية لتقييم الاستنباط، وتحليل المشاعر، وغير ذلك. بعد ذلك، استخدم الباحثون ردود جي بي تي 2 لتلك الاختبارات والأحاجي لتدريب جي بي تي 4 على تنفيذ المهام نفسها. ويمكن تشبيه الأمر بتكليف تلميذ في الصف الثالث الابتدائي بتدريب تلميذ في الصف الثاني عشر (الثالث الثانوي) على مهمة ما. تكمن الحيلة في تحقيق هذا الأمر دون تعرض جي بي تي 4 إلى تراجع كبير في الأداء.
وقد حصل الباحثون على نتائج متفاوتة. أجرى الفريق عملية قياس لفرق الأداء بين جي بي تي 4 المُدَرَّب على أفضل تخمينات جي بي تي 2، وجي بي تي 4 المُدَرَّب على الإجابات الصحيحة. وتبين أن جي بي تي 4 الذي دربه جي بي تي 2 تفوق على جي بي تي 2 في المهام اللغوية بنسبة 20%-70%، لكنه حقق مستوى أقل من الأداء في أحاجي الشطرنج.
ويقول بافيل إزمايلوف، عضو الفريق، إن مجرد تفوق جي بي تي 4 على معلمه أمر مثير للاستغراب: "إنها نتيجة مفاجئة وإيجابية جداً". لكنه يضيف قائلاً إن أداءه في هذه الحالة أقل بكثير مما يستطيع فعله بنفسه. استنتج الفريق أن المقاربة واعدة، لكنها تحتاج إلى المزيد من العمل.
عمل يستحق الثناء
يقول باحث الذكاء الاصطناعي في جامعة شتوتغارت في ألمانيا، تيلو هاغيندورف، الذي يعمل على المواءمة: "إنها فكرة مثيرة للاهتمام". غير أنه يعتقد أن جي بي تي 2 قد يكون ضعيف الأداء إلى درجة تمنعه من أن يكون معلماً جيداً. ويقول: "يميل جي بي تي 2 إلى تقديم ردود خالية من المعنى في أي مهمة معقدة بعض الشيء أو تتضمن درجة من المعالجة المنطقية". ويرغب هاغيندورف في معرفة ما يمكن أن يحدث عند استخدام جي بي تي 3 بدلاً منه.
يشير هاغيندورف أيضاً إلى أن هذه المقاربة لا تعالج السيناريو الافتراضي الذي طرحه سوتسكيفير، إذ يخفي الذكاء الاصطناعي الخارق سلوكه الحقيقي، ويتظاهر بأنه متوائم على نحو مغاير للواقع. يقول هاغيندورف: "من المرجح أن تمتلك النماذج المستقبلية الخارقة قدرات جديدة غير معروفة لدى الباحثين. كيف يمكن تحقيق المواءمة في هذه الحالات؟"
اقرأ أيضاً: ما تأثير إقالة سام ألتمان من منصب الرئيس التنفيذي لشركة أوبن أيه آي على صناعة الذكاء الاصطناعي؟
لكنه يضيف إن كشف العيوب أمر سهل. ويشعر بالسرور لانتقال أوبن أيه آي من مرحلة التكهنات والتوقعات إلى مرحلة التجارب: "تستحق أوبن أيه آي الثناء على هذا العمل".
تسعى أوبن أيه آي إلى ضم المزيد من الباحثين إلى هذا العمل. فقد أعلنت الشركة، إضافة إلى هذا التحديث حول بحثها، عن تخصيص دفعة مالية جديدة بقيمة 10 ملايين دولار لتمويل الباحثين الذين يدرسون المواءمة الفائقة. وستقدم الشركة منحاً بقيم تصل إلى مليوني دولار إلى المختبرات الجامعية، والمؤسسات اللاربحية، والباحثين المنفردين، والزمالات التي مدتها سنة واحدة بقيمة 150,000 دولار لطلاب الدراسات العليا. يقول أشينبرينر: "نشعر بحماسة كبيرة تجاه هذا العمل. ونعتقد حقاً أن الباحثين الجدد يستطيعون تقديم إسهامات مهمة".