نموذج أوبن أيه آي يفتح الصندوق الأسود للذكاء الاصطناعي

3 دقيقة
نموذج أوبن أيه آي يفتح الصندوق الأسود للذكاء الاصطناعي
مصدر الصورة: ستيفاني آرنيت/إم آي تي تكنولوجي ريفيو/أدوبي ستوك

طورت شركة أوبن أيه آي نموذجاً تجريبياً يسمى "المحول القليل الأوزان" يضحي بالقوة من أجل الشفافية، ما قد يكشف النقاب عن كيفية عمل النماذج اللغوية الكبيرة:

  • الشفافية على حساب الإمكانات: لا تتجاوز قدرات النموذج الجديد قدرات النموذج جي بي تي 1 لعام 2018، لكن بنيته المبسطة تتي…

عمدت الشركة الصانعة لتشات جي بي تي، أوبن أيه آي، إلى بناء نموذج لغوي تجريبي كبير، فهمه أسهل بكثير مقارنة بالنماذج النموذجية.

هذا أمر بالغ الأهمية، لأن النماذج اللغوية الكبيرة اليوم هي صناديق سوداء: لا أحد يفهم كيفية عملها بالضبط. إن بناء نموذج أكثر شفافية يسلط الضوء على كيفية عمل النماذج اللغوية الكبيرة عموماً، ما يساعد الباحثين على معرفة سبب هلوسة النماذج، ولماذا تنحرف عن مسارها الصحيح، وإلى أي مدى يجب أن نثق بها في المهام الحرجة.

قال ليو غاو، عالم الأبحاث في أوبن أيه آي، لمجلة إم آي تي تكنولوجي ريفيو في عرض حصري للعمل الجديد: "كلما ازدادت قوة أنظمة الذكاء الاصطناعي هذه، ازداد مستوى دمجها أكثر فأكثر في مجالات مهمة للغاية". وأضاف: "من المهم جداً التأكد من أنها آمنة".

 المحول القليل الأوزان

لا يزال هذا البحث في مراحله الأولى. فالنموذج الجديد، الذي يطلق عليه اسم "المحول القليل الأوزان"، أصغر بكثير وأقل قدرة بكثير من النماذج الرائدة في السوق الشاملة مثل جي بي تي الخاص بالشركة، و"كلود" من شركة أنثروبيك، و"جيميناي" من شركة جوجل ديب مايند. ويقول غاو إنه على أقصى تقدير يماثل في قدرته نموذج جي بي تي 1، وهو نموذج طورته أوبن أيه آي في عام 2018 (على الرغم من أنه وزملاءه لم يجروا مقارنة مباشرة).

لكن الهدف ليس منافسة أفضل النماذج في فئتها (على الأقل، ليس بعد). بدلاً من ذلك، ومن خلال النظر في كيفية عمل هذا النموذج التجريبي، تأمل أوبن أيه آي في معرفة الآليات الخفية داخل تلك الإصدارات الأكبر والأفضل من هذه التكنولوجيا.

تقول عالمة الرياضيات في كلية بوسطن التي تدرس كيفية عمل النماذج اللغوية الكبيرة والتي لم تشارك في المشروع، إليسيندا غريغسبي، إنه بحث مثير للاهتمام: "أنا متأكدة من أن الأساليب التي يقدمها سيكون لها تأثير كبير".

ويتفق عالم الأبحاث في شركة الذكاء الاصطناعي الناشئة غود فاير، لي شاركي، مع هذا الرأي. ويقول: "يستهدف هذا العمل تحقيق الهدف الصحيح ويبدو أنه نفذ بإتقان".

اقرأ أيضاً: خوارزميات الصندوق الأسود في الذكاء الاصطناعي تتحيز ضد عرق أو فئة عمرية معينة

لماذا يصعب فهم النماذج؟

يعد عمل أوبن أيه آي جزءاً من مجال بحثي جديد وشائع يعرف باسم "قابلية التفسير الآلي"، الذي يحاول رسم خرائط للآليات الداخلية التي تستخدمها النماذج عند تنفيذها مهام مختلفة.

 هذا أصعب مما يبدو عليه الأمر. فالنماذج اللغوية الكبيرة مبنية بالاعتماد على الشبكات العصبونية، التي تتكون من عقد تسمى عصبونات، وهي مرتبة في طبقات. في معظم الشبكات، يتصل كل عصبون بالعصبونات الأخرى كلها في الطبقات المجاورة له. وتعرف هذه الشبكة باسم "الشبكة الكثيفة".

الشبكات الكثيفة فعالة نسبياً في التدريب والتشغيل، لكنها تنشر ما تتعلمه عبر شبكة واسعة من الوصلات. والنتيجة هي إمكانية تقسيم المفاهيم أو الوظائف البسيطة بين العصبونات في أجزاء مختلفة من النموذج. وفي الوقت نفسه، يمكن لعصبونات محددة أن تمثل سمات مختلفة متعددة، وهي ظاهرة تعرف باسم التراكب (وهو مصطلح مستعار من فيزياء الكم). والنتيجة هي أنه لا يمكن ربط أجزاء محددة من النموذج بمفاهيم محددة.

 يقول قائد فريق قابلية التفسير الآلي في أوبن أيه آي، دان موسينغ: "الشبكات العصبونية كبيرة ومعقدة ومتشابكة وصعبة الفهم". ويضيف: "لقد قلنا نوعاً ما: 'حسناً، ماذا لو حاولنا أن نجعل الأمر مختلفاً عن ذلك؟'".

 فبدلاً من بناء نموذج باستخدام شبكة كثيفة، بدأت أوبن أيه آي تعتمد على نوع من الشبكات العصبونية يعرف باسم المحول القليل الأوزان، حيث يتصل كل عصبون بعدد قليل من العصبونات الأخرى. وقد أجبر هذا النموذج على تمثيل السمات في مجموعات موضعية بدلاً من توزيعها.

 نموذجهم أبطأ بكثير من أي نموذج لغوي كبير مطروح في السوق. ولكن من الأسهل ربط عصبوناته أو مجموعات العصبونات لديه بمفاهيم ووظائف محددة. يقول غاو: "ثمة فرق كبير في مدى قابلية النموذج للتفسير". اختبر غاو وزملاؤه النموذج الجديد في تنفيذ مهام بسيطة للغاية. على سبيل المثال، طلبوا منه إكمال مقطع نصي يبدأ بعلامات اقتباس بإضافة علامات مطابقة في نهايته.

إنه طلب تافه بالنسبة إلى نموذج لغوي كبير. يقول غاو إن فهم كيفية تنفيذ نموذج لمهمة ما، حتى وإن كانت بسيطة كهذه، يتطلب تحليل شبكة معقدة من العصبونات والوصلات. ولكن مع النموذج الجديد، تمكنوا من تتبع الخطوات التي اتخذها النموذج بدقة.

اقرأ أيضاً: ألفا فولد بعد 5 سنوات: كيف يغير الذكاء الاصطناعي دراسة البروتينات؟

ويقول: "لقد وجدنا في الواقع دارة تطابق تماماً الخوارزمية التي يفترض تنفيذها يدوياً، لكن النموذج تعلمها بالكامل. أعتقد أن هذا أمر رائع ومثير للاهتمام حقاً".

أين سيتجه البحث بعد ذلك؟ لا تبدو غريغسبي مقتنعة بإمكانية تطبيق هذه التقنية على نماذج أكبر حجماً يتعين عليها التعامل مع مجموعة متنوعة من المهام الأصعب.

يقر غاو وموسينغ بأن هذا يشكل قيداً كبيراً للنموذج الذي بنياه حتى الآن، ويتفقان على أن هذا النهج لن يؤدي أبداً إلى نماذج تضاهي أداء المنتجات المتطورة مثل جي بي تي 5. ومع ذلك، تعتقد أوبن أيه آي أنها قد تكون قادرة على تحسين التقنية بما يكفي لبناء نموذج شفاف على قدم المساواة مع جي بي تي 3، وهو الإنجاز غير المسبوق الذي حققته الشركة في عام 2021.

يقول غاو: "ربما في غضون بضع سنوات، سنتمكن من الحصول على جي بي تي-3 قابل للتفسير بالكامل، بحيث يمكننا التعمق في كل جزء منه وفهم كيفية عمله بالتفصيل. لو كان لدينا نظام كهذا، لتعلمنا الكثير".

المحتوى محمي