ما هو الذكاء الاصطناعي المنطقي الذي تعمل عليه أوبن أيه آي؟

منذ فترة وجيزة، عقدت قراني في عطلة نهاية الأسبوع في مخيم صيفي، وخلال ذلك اليوم، تنافس ضيوفنا في سلسلة من الألعاب المستوحاة من البرنامج التلفزيوني "سورفايفور" (Survivor)، التي نظمتها بالاشتراك مع زوجتي. عندما كنا نخطط للألعاب في أغسطس/آب، أردنا أن تكون إحدى محطات الألعاب تحدياً للذاكرة، حيث يتعين على بعض المشاركين من أصدقائنا وأفراد عائلتينا أن يتذكروا جزءاً من قصيدة، ويتلوها على أفراد الفريق الآخرين حتى يعيدوا كتابتها باستخدام مجموعة من الألواح الخشبية.

وبدا لي أن جي بي تي 4 أو (GPT-4o)، النموذج الأول من أوبن أيه آي في ذلك الحين، سيكون مثالياً لهذه المهمة. وهكذا، طلبت منه أن يؤلف قصيدة قصيرة تدور فكرتها الرئيسية حول حفل الزفاف، مع شرط يقتضي بأن يظهر كل حرف عدداً معيناً من المرات فقط، بحيث نضمن أن تتمكن الفرق المشاركة من إعادة كتابتها باستخدام الألواح الخشبية المتاحة. غير أن جي بي تي أو فشل فشلاً ذريعاً. فقد أصر النموذج، مراراً وتكراراً، على أن قصيدته التي ألفها تحقق الشرط المطلوب، على الرغم من أنها لم تكن كذلك. وكان النموذج يعدّ الأحرف على نحو صحيح فقط بعد تأليف القصيدة، على حين واصل كتابة قصائد لم تحقق المطلوب في الأمر النصي. لم يكن لدينا ما يكفي من الوقت لتأليف أبيات القصيدة يدوياً بدقة، ولهذا، تخلينا عن فكرة القصيدة بالكامل، وقررنا تغيير التحدي الذي سيخوضه المدعوون إلى تذكّر مجموعة من الأشكال المصنوعة من ألواح ملونة. (لاقت هذه الفكرة إعجاباً كبيراً من أصدقائنا وأفراد عائلتينا، الذين تنافسوا أيضاً في ألعاب كرة المناورة، ورمي البيض، وأمسك العلم).

أو وَن: نموذج تعد أوبن أيه آي بأن يتفوق على جي بي تي 4

غير أن أوبن أيه آي أطلقت مؤخراً نموذجاً جديداً يحمل اسم "أو وَن" (كانت تشير إليه سابقاً بالاسم الرمزي "ستروبيري" [Strawberry] وقبل ذلك بالاسم الرمزي "كيو ستار" [Q*])، الذي يتفوق على "جي بي تي 4 أو" بكثير لهذا النوع من الأغراض.

كانت النماذج السابقة مصممة للمهام اللغوية ومناسبة تماماً لها، مثل الكتابة والتحرير، غير أن ”أو ون" من أوبن أيه آي يركز على "التفكير" المتعدد الخطوات، وهي العملية التي نحتاج إليها للتعامل مع الرياضيات المتقدمة والبرمجة وغير ذلك من الأسئلة في مجال العلوم والتكنولوجيا والهندسة والرياضيات. ووفقاً لأوبن أيه آي، يعتمد هذا النموذج على تقنية "سلسلة الأفكار" (chain of thought). كتبت الشركة في منشور مدونة لها على موقعها الإلكتروني تقول: "يتعلم النموذج كيفية التعرف على أخطائه وتصحيحها. ويتعلم كيفية تفكيك الخطوات المعقدة إلى خطوات أبسط. ويتعلم تجربة طريقة مختلفة عندما لا تنجح الطريقة الحالية".

نموذج يركز على التفكير المنطقي

تشير الاختبارات التي أجرتها أوبن أيه آي إلى أنها حققت نجاحاً باهراً. فقد حقق النموذج نتيجة تكافئ التفوق على نسبة 89% من المشاركين الذين أجابوا عن أسئلة من المؤسسة المختصة بمسابقات البرمجة كود فورسز (Codeforces)، كما حقق نتيجة تتيح له أن يحتل موقعاً ضمن أفضل 500 طالب من طلاب المرحلة الثانوية في أولمبياد الرياضيات الأميركي، الذي يشمل مجالات الهندسة ونظرية الأعداد وغير ذلك من المواضيع الرياضية. أيضاً، تدرب النموذج على الإجابة عن أسئلة من مستوى الدكتوراة في مواضيع تتراوح من الفيزياء الفلكية إلى الكيمياء العضوية.

حقق النموذج الجديد لدى الإجابة عن أسئلة من أولمبياد الرياضيات دقة بلغت 83.3%، في حين حقق "جي بي تي 4 أو" دقة بلغت 13.4%. أما في الأسئلة من مستوى الدكتوراة، فقد بلغت دقته الوسطية 78%، على حين حقق الخبراء البشر دقة بلغت 69.7%، وحقق "جي بي تي 4 أو" دقة بلغت 56.1%. (في ضوء هذه الإنجازات، ليس من المفاجئ أن يكون النموذج الجديد بارعاً للغاية في تأليف قصيدة لألعاب يوم زفافنا، على الرغم من أنها لم تكن مثالية، فقد استخدم الحرفين S وT بتواتر تجاوز ما طلبنا منه).

إذاً، ما الذي يجعل هذا الأمر مهماً؟

لقد كان الجزء الأكبر من التقدم الذي أحرزته النماذج اللغوية الكبيرة حتى الآن محصوراً بمجال اللغة، ما أدى إلى ظهور بوتات الدردشة والمساعدات الصوتية القادرة على تفسير الكلمات وتحليلها وتوليدها. غير أن النماذج اللغوية الكبيرة ترتكب الكثير من الأخطاء الفادحة من حيث صحة المعلومات الواردة في مخرجاتها، كما أنها لم تتمكن من إثبات امتلاكها للمهارات اللازمة لحل المعضلات المهمة في حقول مثل اكتشاف الأدوية وعلم المواد والبرمجة والفيزياء. يمثل نموذج "أو ون" من أوبن أيه آي أول دلالة تشير إلى أن النماذج اللغوية الكبيرة قد تصبح قريباً منظومات مرافقة مفيدة فعلاً للباحثين البشر في هذه الحقول.

إنه أمر مهم للغاية، لأنه يعني طرح نموذج ذكاء اصطناعي مزود بآلية التفكير بطريقة "سلسلة الأفكار" على الجمهور، كما يقول باحث الذكاء الاصطناعي ومؤسس الشركة الناشئة المختصة بالنماذج اللغوية الكبيرة فيكسي (Fixie)، مات ويلش.

يقول ويلش: "إن قدرات التفكير موجودة على نحو مباشر في هذا النموذج، ما يعني أن المستخدم لن يضطر إلى استخدام أدوات منفصلة لتحقيق نتائج مماثلة. وأتوقع أن هذا سيؤدي إلى ارتفاع مستوى توقعات الناس بشأن قدرات نماذج الذكاء الاصطناعي".

غير أنه من الأفضل أن نتعامل مع مقارنات أوبن أيه آي لقدرات نموذجها مع "المهارات البشرية" بشيء من التحفظ والشك، كما يقول الأستاذ المساعد المختص بالرياضيات وعلوم الكمبيوتر في كلية إمبيريال كوليدج لندن، إيف ألكسندر دي مونتجوي. فمن الصعب للغاية إجراء مقارنة حقيقية بين النماذج اللغوية الكبيرة والبشر من حيث الأساليب المُستَخدمة في مهام مثل حل المسائل الرياضية من الصفر.

ما زال يفتقر إلى التفكير غير المقيد!

إضافة إلى ذلك، يقول باحثو الذكاء الاصطناعي إن قياس مدى قدرة نموذج مثل "أو ون" على "التفكير" أصعب مما يبدو. فإذا قدم النموذج إجابة صحيحة عن سؤال ما، فهل هذا يعني أنه توصل إلى الإجابة المنطقية من خلال عملية تفكير ناجحة؟ أم أنه تمكن من تحقيق هذه النتيجة بمساعدة ركيزة انطلاق معرفية كافية ومدمجة في بنيته الداخلية؟ هذا النموذج "ما زال يفتقر إلى التفكير غير المقيد" (أي الإجابة عن سؤال دون تحديد احتمالات أو نطاق للإجابة)، وفقاً لمنشور كتبه باحث الذكاء الاصطناعي في جوجل، فرانسوا شوليه، على منصة إكس (X).

وأخيراً، ثمة جانب يتعلق بالثمن. فهذا النموذج الذي يتميز بقدرات تفكير عالية لا يمكن الحصول عليه بثمن رخيص. على الرغم من تضمين الوصول إلى بعض الإصدارات من النموذج في الاشتراكات المميزة لخدمات أوبن أيه آي المدفوعة، فإن مطوري البرمجيات الذين يستخدمون "أو ون" عبر واجهة برمجة التطبيقات (API) سيدفعون ثلاثة أضعاف ما يدفعونه لقاء استخدام "جي بي تي 4 أو"، أي 15 دولاراً لكل مليون من رموز الدخل في "أو ون"، و5 دولارات في حالة "جي بي تي 4 أو". أيضاً، لن يكون النموذج الجديد الاختيار المفضل لدى معظم المستخدمين لأداء المهام التي يغلب عليها الطابع اللغوي، فما زال "جي بي تي 4 أو" الخيار الأفضل في هذه الحالة، وفقاً لاستطلاعات الرأي بين مستخدمي أوبن أيه آي.

ما هي الآفاق الجديدة التي سيفتحها هذا النموذج؟ لن نعرف الإجابة بالضبط قبل حصول الباحثين والمختبرات على ما يلزم من الوقت والتمويل، إضافة إلى إمكانية الوصول إلى النموذج الجديد، لإجراء التجارب عليه واكتشاف حدود قدراته. لكن هذا النموذج يمثل دون شك دلالة تشير إلى أن السباق في مجال بناء النماذج التي تستطيع التفوق على البشر في التفكير قد بدأ.