ما الذي يُميّز نموذج جي بي تي-4.5 الذي تقول أوبن أيه آي إنه الأفضل حتى الآن؟

أصدرت شركة أوبن أيه آي (OpenAI) جي بي تي 4.5 (GPT-4.5)، وهو إصدار جديد من نموذجها اللغوي الكبير الرائد. تزعم الشركة أنه أكبر وأفضل نموذج لها للدردشة الشاملة حتى الآن. تقول عالمة الأبحاث في أوبن أيه آي، ميا غلايس: "إنه يمثّل حقاً خطوة مهمة إلى الأمام بالنسبة لنا".

منذ إطلاق ما يُسمّى بنموذجي التفكير المنطقي "أو 1" (o1) و"أو 3" (o3)، تعمل أوبن أيه آي على تسويق اثنين من خطوط الإنتاج. يعتبر النموذج جي بي تي 4.5 جزءاً من مجموعة النماذج التي لا تتمتّع بالتفكير المنطقي، وهو ما يُسميه زميل غلايس وعالم الأبحاث أيضاً، نِك رايدر، "حلقة ضمن سلسلة جي بي تي الكلاسيكية".

يمكن للأشخاص الذين لديهم حساب تشات جي بي تي برو (ChatGPT Pro)، الذي يوفّر ميزات متقدمة مقابل 200 دولار شهرياً، تجربة جي بي تي 4.5 اليوم. تقول أوبن أيه آي إنها ستبدأ طرحه للمستخدمين الآخرين في الأسبوع الأول من شهر مارس/آذار.

تأثير حجم النماذج

أظهرت أوبن أيه آي مع كل إصدار من نماذج جي بي تي الخاصة بها، أن زيادة حجم النموذج تعني الحصول على قدرات أفضل. لكنْ كثُر الحديث عن أن هذا النهج وصل إلى طريق مسدود، ومن الشخصيات التي تحدثت عن ذلك كبير العلماء السابق في أوبن أيه آي، إيليا سوتسكيفر. وتبدو مزاعم الشركة بشأن جي بي تي 4.5 بمثابة صفعة على وجه المشككين.

تلتقط النماذج اللغوية الكبيرة كلها الأنماط الكامنة في مليارات المستندات التي تتدرب عليها. تعلمت النماذج الأصغر حجماً بناء الجمل والحقائق الأساسية. أمّا النماذج الأكبر حجماً فيمكنها العثور على أنماط أكثر تحديداً مثل الإشارات العاطفية، كما الحال عندما تشير كلمات المتحدث إلى العداء، يقول رايدر: "هذه الأنماط الدقيقة كلها التي ترِد خلال محادثة بشرية، هي الأجزاء التي ستلتقطها هذه النماذج التي تزداد حجماً".

تقول غلايس: "لدى النموذج الجديد القدرة على الانخراط في محادثات ودية وبديهية وطبيعية وسلسة. ونعتقد أنه يتمتع بقدرات أعلى لفهم ما يعنيه المستخدمون، خاصةً عندما تكون توقعاتهم ضمنية بدرجة أكبر، ما يؤدي إلى تقديم إجابات دقيقة ومدروسة".

يقول رايدر: "نحن نعرف نوعاً ما القوى المحركة التي يمكن الاستفادة منها في هذه المرحلة، والآن يتعلق الأمر في الواقع بدفع عجلة هذه القوى. يمثّل هذا في المقام الأول اختباراً عملياً في توسيع قدرات الحوسبة، وتوسيع نطاق البيانات، وإيجاد طرق تدريب أكثر كفاءة، ثم توسيع آفاق الإمكانات".

لم تفصح أوبن أيه آي عن مدى حجم نموذجها الجديد بالضبط. لكنها تقول إن القفزة التي حققتها في الحجم من النموذج "جي بي تي 4 أو" إلى "جي بي تي 4.5" هي القفزة نفسها التي حققتها من النموذج "جي بي تي 3.5" إلى "جي بي تي 4 أو". وقد قدّر الخبراء أن جي بي تي 4 يمكن أن يحتوي على ما يصل إلى 1.8 تريليون متغير، وهي القيم التي يجري تعديلها عند تدريب النموذج.

وقد درّبت الشركة جي بي تي 4.5 باستخدام تقنيات مماثلة لسابقه جي بي تي 4 أو، بما في ذلك الضبط الدقيق والتعلم المعزز بقيادة البشر مع الاعتماد على الملاحظات البشرية.

أنظمة أذكى

يقول رايدر: "إن مفتاح إنشاء أنظمة ذكية هو الوصفة التي نتبعها منذ سنوات عديدة، وهي إيجاد نماذج قابلة للتطوير حيث يمكننا ضخ المزيد من الموارد للحصول على أنظمة أذكى".

على عكس النماذج المنطقية، مثل "أو 1" و"أو 3"، التي تعمل من خلال تقديم الإجابات خطوة تلو الأخرى، فإن النماذج اللغوية الكبيرة العادية مثل جي بي تي 4.5 تقدم الإجابة الأولى التي تتوصل إليها. لكن جي بي تي 4.5 أكثر عمومية. عند اختبار هذا النموذج باستخدام الاختبار المعياري سيمبل كيو أيه (SimpleQA)، وهو نوع من اختبارات المعرفة العامة التي تتضمن أسئلة حول مجموعة واسعة من المواضيع، من العلوم والتكنولوجيا إلى البرامج التلفزيونية وألعاب الفيديو، حقق نتيجة 62.5% في حين حقق جي بي تي 4 أو نتيجة 38.6%، أما أو 3 ميني فقد حقق نتيجة 15%.

والأكثر من ذلك، تزعم أوبن أيه آي أن جي بي تي 4.5 يقدّم قدراً أقل بكثير من الإجابات المختلقة (المعروفة باسم الهلوسات). وفي الاختبار نفسه، قدّم جي بي تي 4.5 إجابات مختلقة بنسبة 37.1% من المرات، في حين بلغت النسبة 59.8% من المرات عند جي بي تي 4 أو، وبلغت النسبة 80.3% من المرات عند أو 3 ميني.

لكن في الاختبارات المعيارية الأخرى، بما في ذلك قياس فهم اللغة المتعدد المهام والواسع النطاق (MMLU) وهو اختبار معياري لنماذج اللغة المتعددة الوسائط، كانت المكاسب التي حققتها نماذج أوبن أيه آي السابقة هامشية. وبناءً على اختبارات معيارية مخصصة للعلوم والرياضيات القياسية، حقق جي بي تي 4.5 نتائج أسوأ من أو 3.

قد لا يستحق الأمر العناء من أوبن أيه آي!

يبدو أن سحر جي بي تي 4.5 الخاص يكمن في المحادثات التي يجريها. يقول المختبِرون البشريون الذين وظفتهم أوبن أيه آي إنهم يفضّلون إجابات جي بي تي 4.5 على إجابات جي بي تي 4 أو في الاستفسارات المتعلقة بالحياة اليومية والاستفسارات المهنية والمهام الإبداعية، بما في ذلك تأليف القصائد. (يقول رايدر إنه رائع أيضاً في فن الأسكي [ASCII art] الكلاسيكي على الإنترنت).

لكن بعد سنوات من اعتلاء أوبن أيه آي القمة، أصبح لدى الشركة الآن جمهور صعب. يقول المؤسس المشارك والرئيس التنفيذي للتكنولوجيا في شركة رايتر (Writer) الناشئة التي تعمل على تطوير نماذج لغوية كبيرة للعملاء من المؤسسات، وسيم الشيخ: "التركيز على الذكاء العاطفي والإبداع أمر رائع لحالات الاستخدام المتخصصة مثل مدربي الكتابة ورفاق العصف الذهني".

ويُضيف: "لكن جي بي تي 4.5 يبدو كأنه طلاء جديد لامع يغطي السيارة القديمة نفسها. يمكن أن يؤدي تعزيز نموذج ما بقدرات إضافية من الحوسبة وكميات إضافية من البيانات إلى جعله يبدو أكثر سلاسة، لكنه لا يغير قواعد اللعبة".

ويُضيف قائلاً: "لا يستحق الأمر العناء عندما تفكر في تكاليف الطاقة والتعقيد وحقيقة أن معظم المستخدمين لن يلاحظوا الفرق في الاستخدام اليومي. أفضّل أن أراهم يحولون تركيزهم نحو الكفاءة أو حل المشاكل المتخصصة بدلاً من الاستمرار في زيادة حجم النموذج نفسه".

قال سام ألتمان إن جي بي تي 4.5 سيكون الإصدار الأخير في مجموعة أوبن أيه آي الكلاسيكية، وإن جي بي تي 5 (GPT-5) سيكون نموذجاً هجيناً يجمع بين نموذج لغوي كبير للأغراض العامة ونموذج يستخدم التفكير المنطقي.

يقول الشيخ: "جي بي تي 4.5 هو بمثابة مكالمة هاتفية تجريها أوبن أيه آي بينما تحضر مشروعاً أكبر خلف الأبواب المغلقة. حتى ذلك الحين، يبدو الأمر وكأن أوبن أيه آي تأخذ استراحة قصيرة".

ومع ذلك، فإن أوبن أيه آي مقتنعة بأن نهجها القائم على تضخيم النماذج لا يزال قادراً على المضي قدماً. يقول رايدر: "أنا شخصياً متفائل جداً بشأن إيجاد طرق لتجاوز تلك العقبات والاستمرار في توسيع القدرات. وأعتقد أن هناك شيئاً عميقاً وجديراً بالاهتمام للغاية بشأن مطابقة الأنماط الكامنة في المعارف البشرية كافة".