ما هو «جي بي تي-4»؟ ولماذا قد يمثل علامة فارقة في تاريخ الذكاء الاصطناعي؟

كشفت شركة أوبن أيه آي (OpenAI) أمس النقاب عن نموذجها الأكثر تقدماً جي بي تي-4 (GPT-4)، لتنهي بذلك شهوراً طويلة من الانتظار وتضع حداً للشائعات التي دارت حول إمكانات وقدرات هذا النموذج الأحدث في عائلة النماذج اللغوية الكبيرة التي طورتها الشركة الناشئة، والتي تدعم تطبيقات مثل بوت الدردشة الشهير تشات جي بي تي (ChatGPT) ومحرك البحث بينغ (Bing).

قدرات لغوية كبيرة يتمتع بها "جي بي تي-4"

تقول الشركة إن "جي بي تي-4" هو الخطوة الأحدث في جهودها لتوسيع نطاق التعلم العميق، موضحة أن بإمكانه حل المشكلات الصعبة بدقة أكبر، وذلك بفضل معرفته العامة الأوسع نطاقاً وقدراته على حل المشكلات. وتضيف أن هذا النموذج الكبير "أكثر إبداعاً وتعاوناً" و"أقل تحيزاً"، وأنه قادر على إنشاء الكتابات الإبداعية والتقنية وتحريرها، مثل تأليف الأغاني أو كتابة سيناريوهات أو تعلم أسلوب كتابة المستخدم.

النموذج الجديد متاح حالياً لعامة الناس عبر خدمة تشات جي بي تي بلس (ChatGPT Plus)، وهي إصدار مدفوع تبلغ قيمة اشتراكه الشهري 20 دولاراً (لكن الخدمة ليست متوفرة في العديد من الدول حتى الآن). كما يمكن للمطورين الذين يرغبون في استخدامه لبناء التطبيقات والخدمات التسجيل في قائمة انتظار للوصول إلى واجهة برمجة التطبيقات الخاصة بالنموذج.

يمكن لـ "جي بي تي-4" معالجة ما يصل إلى 25 ألف كلمة، أي نحو 8 أضعاف ما يمكن لـ "تشات جي بي تي" معالجته باستخدام النموذج السابق "جي بي تي 3.5" (GPT-3.5)، وهو ما يسمح باستخدامه في مهام مثل إنشاء المحتوى الطويل، والمحادثات الموسعة، والبحث في المستندات وتحليلها.

تقدم "أوبن أيه آي" هنا مثالاً على المهام المعقدة التي يمكن أن يؤديها "جي بي تي-4"، حيث يُطلب من النموذج شرح حبكة قصة سندريلا في جملة واحدة، ويجب أن تبدأ كل كلمة بالحرف التالي في الأبجدية الإنجليزية (من A إلى Z)، دون تكرار أي أحرف. وقد نفذ النموذج هذه المهمة بدقة عالية. المصدر: أوبن أيه آي

في محاولة معتادة من سام ألتمان المؤسس المشارك والرئيس التنفيذي لـ "أوبن أيه آي" لتقليل الضجة المحيطة بمنتجات الشركة وتهدئة حماس المستخدمين، اعتبر أنه على الرغم من أن "جي بي تي-4" هو النموذج "الأكثر كفاءة وتوافقاً حتى الآن" لدى شركته، فإنه "لا يزال معيباً، ولا يزال قاصراً، ولا يزال يبدو أكثر إثارة للإعجاب عند استخدامه للمرة الأولى مما هو عليه بعد قضاء المزيد من الوقت معه".

وأضاف، في سلسلة تغريدات عبر تويتر، أن واجهة برمجة التطبيقات تسمح حالياً للمطورين (وقريباً لمستخدمي تشات جي بي تي) بتخصيص سلوك النموذج على نحو ملموس. بمعنى أنك إذا كنت تريد ذكاءً اصطناعياً يجيب عليك دائماً بأسلوب شكسبير، أو صيغة جسون (json)، فقد أصبح بإمكانك فعل ذلك الآن".

here is GPT-4, our most capable and aligned model yet. it is available today in our API (with a waitlist) and in ChatGPT+.https://t.co/2ZFC36xqAJ

it is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it.

— Sam Altman (@sama) March 14, 2023

نموذج متعدد الوسائط

بالإضافة إلى معالجة النصوص، يتميز النموذج الجديد بأنه "متعدد الوسائط"، ما يعني أنه يقبل الصور أيضاً كمدخلات ويقوم بتحليلها وتصنيفها (لكنه يقدم مخرجات نصية فقط)، ويقوم بكتابة أوصاف الصور وتسمياتها التوضيحية. على سبيل المثال، يمكن أن يقدم "جي بي تي-4" اقتراحات لوصفات الطعام من صورة للمكونات.

يقول المؤسس المشارك ورئيس "أوبن أيه آي" غريغ بروكمان، إن "جي بي تي-4" ليس مجرد نموذج لغوي، وإنما أيضاً نموذج رؤية". وفي بث مباشر ظهر فيه، مساء أمس، أطلع بروكمان المستخدمين على نظرة خاطفة على ميزة التعرف على الصور التي يتمتع بها النموذج، والتي لا تزال حتى الآن في مرحلة الاختبار المقصور على شركة واحدة تسمى بي ماي آيز (Be My Eyes).

خلال البث، طلب بروكمان من النموذج شرح السبب في كون صورة سنجاب يمسك بكاميرا مضحكة، فقال "جي بي تي-4": "لأننا لا نتوقع منه استخدام الكاميرا أو التصرف كبشر". وفي مثال آخر، طلب بروكمان من "جي بي تي-4" تحويل رسم يدوي بقلم رصاص إلى موقع ويب، وهو ما نفذه النموذج بنجاح.

نفس المشكلات القديمة ولكن بدرجة أقل

تشير الشركة الناشئة، المدعومة من مايكروسوفت، إلى أنه في حين أن الإصدار الجديد أقل قدرة من البشر في العديد من سيناريوهات العالم الحقيقي، إلا أنه يقدم أداءً يوازي مستوى الأداء البشري في مختلف المعايير المرجعية المهنية والأكاديمية. وكمقارنة مع سابقيه، تمكن "جي بي تي-4" من اجتياز امتحان مُحاكٍ للعمل بالمحاماة بدرجة تضعه ضمن أفضل 10% من المتقدمين للاختبار، بينما كانت نتيجة "جي بي تي 3.5" ضمن أدنى 10%.

تستدعى هذه الإمكانات الكبيرة مخاطر كبيرة أيضاً. لذلك، للسيطرة على ردود الإصدار الجديد وضبط مستوى السلامة، ذكرت "أوبن أيه آي" أنها أمضت 6 أشهر في العمل على تحسين ميزات الأمان في النموذج، وأنها قامت بتدريبه على المزيد من الملاحظات البشرية -بما في ذلك الملاحظات المقدمة من مستخدمي "تشات جي بي تي"- كما عملت مع أكثر من 50 خبيراً للحصول على ملاحظات أولية في مجالات تشمل أمن الذكاء الاصطناعي.

ومع ذلك، فقد حذرت الشركة من أن "جي بي تي-4" لا يزال غير موثوق به كلياً، إذ يعاني من العديد من المشكلات التي تعاني منها النماذج اللغوية السابقة، بما في ذلك الميل لمشاركة معلومات مضللة، والقابلية لإنشاء نص عنيف وضار، واختلاق المعلومات (أو ما يُطلق عليه اسم ظاهرة الهلوسة). وفي أحد الأمثلة التي استشهدت بها الشركة، وصف النموذج المطرب الأميركي ألفيس بريسلي بأنه "ابن أحد الممثلين".

إضافة إلى ذلك، تقول "أوبن أيه آي" إن "جي بي تي-4" يفتقر عموماً إلى المعرفة بالأحداث التي حدثت بعد انقطاع الغالبية العظمى من بياناته (سبتمبر/ أيلول 2021)، ولا يتعلم من تجربته. وفي بعض الأحيان يمكن أن يرتكب أخطاء منطقية بسيطة لا يبدو أنها تتماشى مع الكفاءة التي يتمتع بها عبر العديد من المجالات، أو يكون ساذجاً للغاية في قبول عبارات خاطئة واضحة من المستخدم".

على الرغم من هذه التحذيرات، تظهر التقييمات الداخلية للشركة أن احتمالية رد الإصدار الجديد على الطلبات المتعلقة بـ "المحتوى غير المسموح به" تقل بنسبة 82% عن "جي بي تي 3.5"، كما أن احتمالية تقديم ردود واقعية ارتفعت بنسبة 40% عن النموذج السابق.

شراكات متعددة المجالات

تضمن الإطلاق الرسمي للنموذج إعلاناً متزامناً عن دخول "أوبن أيه آي" في شراكات مع العديد من المؤسسات المختلفة لدمج "جي بي تي-4" في منتجاتها، بما في ذلك تطبيق تعلم اللغة دولينغو (Duolingo)، ومؤسسة الخدمات المالية والاستثمارية مورغان ستانلي، والحكومة الآيسلندية. تستهدف هذه الشراكات بشكل أساسي تطوير بوتات دردشة يمكنها مساعدة الأشخاص على استخدام لغة طبيعية عند التعامل مع هذه المنصات والمؤسسات.

في تطبيق دولينغو، على سبيل المثال، سيوفر دمج "جي بي تي-4" تقديم خدمة جديدة تسمى دولينغو ماكس (Duolingo Max)، تتيح للمستخدمين المتحدثين باللغة الإنجليزية محادثات مدعومة بالذكاء الاصطناعي باللغتين الفرنسية أو الإسبانية، كما يمكنهم استخدام النموذج لشرح الأخطاء التي ارتكبها متعلمو اللغة.

بالإضافة إلى هذه الشراكات الجديدة، نشرت شركة مايكروسوفت أمس تأكيداً أن محرك البحث "بينغ" كان يعمل بالفعل خلال الفترة الماضية باستخدام هذا النموذج. وأضافت الشركة، في تدوينة على موقعها، أنك "إذا كنت قد استخدمت معاينة "بينغ" في أي وقت خلال الأسابيع الخمسة الماضية، فقد اختبرت بالفعل إصداراً مبكراً من هذا النموذج القوي".

مع كل هذه القدرات الكبيرة التي يبدو أن النموذج يتمتع بها، لا تشير التعليقات والملاحظات التي صدرت خلال الساعات القليلة الماضية، أنه يقترب من الوصول إلى مستوى "الذكاء الاصطناعي العام" الذي يتحدث عنه الخبراء في وادي السيليكون منذ أشهر، وهي الشائعات التي وصفها ألتمان قبل ذلك بأنها "هراء كامل". وبدلاً من ذلك، اكتفت الشركة بالقول إنه مع تزايد أعداد المستخدمين خلال الفترة القادمة، فإنها ستسعى إلى تحديث وتحسين "جي بي تي-4" بإيقاع منتظم.