لخص الرئيس التنفيذي لشركة جوجل ديب مايند، ديميس هاسابيس، الأمر في ثلاث كلمات: "هذا أمر محرج".
كان هاسابيس يرد عبر منصة إكس على منشور متحمس للغاية كتبه سيباستيان بوبيك، وهو عالم أبحاث في شركة أوبن أيه آي المنافسة، معلناً أن اثنين من علماء الرياضيات قد استخدما أحدث نموذج لغوي كبير من أوبن أيه آي، وهو جي بي تي 5، لإيجاد حلول لعشر مسائل في الرياضيات لم تحل بعد. وقد هتف بوبيك قائلاً: "لقد بدأ تسريع وتيرة التقدم العلمي عبر الذكاء الاصطناعي رسمياً".
ارتدوا قبعات الرياضيات لدقيقة واحدة، ودعونا نلقي نظرة على ما كان يدور حوله هذا اللحم البقري من منتصف أكتوبر. إنه مثال مثالي لما هو الخطأ في الذكاء الاصطناعي الآن.
دعونا نحلل الأمور بعقلانية للحظة، ونلقي نظرة على جوهر هذا الخلاف الذي نشب في منتصف أكتوبر/تشرين الأول. إنه مثال واضح على ما يعتري الذكاء الاصطناعي من مشكلات في الوقت الراهن.
اقرأ أيضاً: تحقق شركة ديب مايند الأهداف الطبية التي أنشئت لأجلها؟
حماس لحل معضلة رياضية باستخدام الذكاء الاصطناعي
كان بوبيك متحمساً لأن جي بي تي 5 يبدو أنه تمكن بطريقة ما من حل عدد من الألغاز المعروفة باسم مسائل إردوس غير المحلولة.
بول إردوس، أحد أكثر علماء الرياضيات غزارة في إنتاج الأوراق البحثية في القرن العشرين، ترك وراءه مئات الألغاز عند وفاته. وللمساعدة في تتبع أي منها قد جرى حله، أنشأ توماس بلوم، عالم الرياضيات في جامعة مانشستر بالمملكة المتحدة، موقع erdosproblems.com، الذي يسرد أكثر من 1,100 مسألة ويشير إلى أن نحو 430 منها بات محلولاً.
عندما احتفل بوبيك بالإنجاز غير المسبوق الذي حققه جي بي تي 5، سارع بلوم إلى انتقاده، وكتب على منصة إكس: "هذا تحريف فادح"، وأوضح بلوم أن المسألة لا تعد بالضرورة غير محلولة إذا لم يدرج الموقع الإلكتروني حلاً لها. فهذا يعني ببساطة أن بلوم لم يكن على علم بوجود حل. ثمة الملايين من أبحاث الرياضيات، ولم يقرأها أحد كلها. لكن من المرجح أن جي بي تي 5 قد قرأها.
اتضح أنه بدلاً من التوصل إلى حلول جديدة لـ 10 مسائل غير محلولة، عمد جي بي تي 5 إلى البحث عبر الإنترنت عن 10 حلول موجودة لم يرها بلوم من قبل. يا للعجب!
اقرأ أيضاً: هل أصبحت الحواسيب جاهزة لحل هذه المعضلة الرياضية المشهورة بصعوبتها؟
ادعاءات يجب عدم التسرع بإطلاقها
ثمة عبرتان يمكن استخلاصهما هنا؛ الأولى هي أنه ينبغي عدم إطلاق ادعاءات متسرعة حول تحقيق إنجازات كبيرة غير مسبوقة عبر وسائل التواصل الاجتماعي، بل يتطلب الأمر التريث في الحكم والتمحيص المتعمق.
والثانية هي أن قدرة جي بي تي 5 على العثور على أعمال سابقة لم يكن بلوم على علم بها أمر مذهل أيضاً. لقد طغت الضجة الإعلامية على شيء كان ينبغي أن يكون رائعاً في حد ذاته.
يبدي علماء الرياضيات اهتماماً كبيراً باستخدام النماذج اللغوية الكبيرة للبحث في أعداد هائلة من النتائج الموجودة، كما أخبرني فرانسوا شارتون، وهو عالم أبحاث يدرس تطبيق النماذج اللغوية الكبيرة على الرياضيات في شركة الذكاء الاصطناعي الناشئة أكسيوم ماث، عندما تحدثت إليه عن معضلة إردوس هذه.
لكن البحث في الأدبيات يبدو مملاً مقارنة بالاكتشاف الحقيقي، خاصة في نظر المتحمسين للذكاء الاصطناعي على وسائل التواصل الاجتماعي. فخطأ بوبيك الفادح ليس المثال الوحيد.
ففي شهر أغسطس/آب، أثبت اثنان من علماء الرياضيات أن النماذج اللغوية الكبيرة آنذاك لم تكن قادرة على حل لغز رياضي يعرف باسم مسألة يو تسومورا رقم 554. ثم بعد شهرين فقط، ضجت وسائل التواصل الاجتماعي بأدلة تظهر أن جي بي تي 5 بات قادراً على ذلك. وعلق أحد المراقبين قائلاً: "إن اللحظة التي مر بها لي سيدول باتت وشيكة الحدوث بالنسبة للكثيرين"، في إشارة إلى بطل لعبة غو الذي خسر أمام الذكاء الاصطناعي ألفا غو (AlphaGo) التابع لشركة ديب مايند في عام 2016.
لكن شارتون أشار إلى أن حل مسألة يو تسومورا رقم 554 ليس بالأمر الصعب على علماء الرياضيات. وقال: "إنه سؤال يمكن أن تطرحه على طالب جامعي. ثمة ميل للمبالغة في كل شيء".
اقرأ أيضاً: ما حقيقة الضجيج الإعلامي حول اقتراب أوبن إيه آي من تطوير الذكاء الاصطناعي العام؟
المبالغة في القدرات ونسب الإنجازات على مواقع التواصل الاجتماعي
في غضون ذلك، بدأت تظهر تقييمات أكثر واقعية لما قد تجيده النماذج اللغوية الكبيرة أو قد لا تجيده. في الوقت الذي كان فيه علماء الرياضيات يتجادلون عبر الإنترنت حول جي بي تي 5، ظهرت دراستان جديدتان تناولتا بعمق استخدام النماذج اللغوية الكبيرة في الطب والقانون (وهما مجالان ادعى صانعو النماذج أن تقنيتهم تتفوق فيهما).
وجد الباحثون أن النماذج اللغوية الكبيرة قادرة على إجراء تشخيصات طبية معينة، لكنها تعاني قصوراً في التوصية بالعلاجات. أما فيما يتعلق بالقانون، فقد وجد الباحثون أن النماذج اللغوية الكبيرة غالباً ما تقدم نصائح غير متسقة وغير صحيحة. وخلص المؤلفون إلى أن "الأدلة المتوفرة حتى الآن لا تفي بمعايير الإثبات المطلوبة".
لكن هذا النوع من الرسائل لا يلقى رواجا كبيراً على منصة إكس، وقال شارتون: "ثمة حماس كبير لأن الجميع يتواصلون بجنون، ولا أحد يريد أن يتخلف عن الركب". فموقع إكس هو المنصة التي يظهر فيها الكثير من أخبار الذكاء الاصطناعي أولاً، حيث تعلن النتائج الجديدة، وحيث تتنافس الجهات الفاعلة الرئيسية مثل سام ألتمان ويان لوكون وغاري ماركوس علناً. من الصعب مواكبة كل هذا، والأصعب من ذلك هو غض الطرف عنه.
لم يكن منشور بوبيك محرجاً إلا لأن خطأه قد اكتشف، ولكن ليست كل الأخطاء معرضة للاكتشاف. فما لم يتغير شيء ما سيستمر الباحثون والمستثمرون والداعمون غير المتخصصين في ترويج بعضهم لبعض. قال لي شارتون: "بعضهم علماء، والكثير منهم ليسوا كذلك، لكنهم جميعاً مهووسون بالعلوم. والادعاءات الضخمة تلقى رواجاً كبيراً على هذه الشبكات".
اقرأ أيضاً: وعود شركات الذكاء الاصطناعي: هل هي حقيقة أمْ مبالغات تسويقية؟
أبعدوا وسائل التواصل الاجتماعي عن التقييم!
ثمة خاتمة مثيرة! لقد كتبت كل ما قرأته للتو أعلاه لعمود "ذي ألغوريثم" في عدد يناير/فبراير 2026 من مجلة إم آي تي تكنولوجي ريفيو (سيصدر قريباً جداً). بعد يومين من نشر ذلك في الصحافة، أخبرتني أكسيوم أن نموذج الرياضيات الخاص بها، أكسيوم بروفر (AxiomProver)، قد حل مسألتين من مسائل إردوس المفتوحة (رقم 124 ورقم 481 لعشاق الرياضيات). هذا إنجاز باهر بالنسبة لشركة ناشئة صغيرة تأسست منذ بضعة أشهر فقط. أجل، الذكاء الاصطناعي يتطور بسرعة!
لكن هذا ليس كل شيء. فقد أعلنت الشركة بعد خمسة أيام أن أكسيوم بروفر قد حل 9 مسائل من أصل 12 مسألة في مسابقة بوتنام لهذا العام، وهي مسابقة رياضيات على مستوى الكليات يعتبرها البعض أصعب من أولمبياد الرياضيات الدولي المعروف (الذي تفوقت فيه نماذج لغوية كبيرة من كل من جوجل ديب مايند وأوبن أيه آي قبل بضعة أشهر).
وقد أشادت بنتيجة بوتنام على منصة إكس أسماء رائدة في هذا المجال، بما في ذلك جيف دين، كبير العلماء في جوجل ديب مايند، وتوماس وولف، المؤسس المشارك في شركة هاغينغ فيس للذكاء الاصطناعي. ومرة أخرى ظهرت المناقشات المألوفة في الردود. فقد أشار بعض الباحثين إلى أنه في حين أن أولمبياد الرياضيات الدولي يتطلب المزيد من الإبداع في حل المسائل، فإن مسابقة بوتنام تختبر المعرفة بالرياضيات، ما يجعلها صعبة للغاية بالنسبة للطلاب الجامعيين، ولكنها أسهل، نظرياً، بالنسبة للنماذج اللغوية الكبيرة التي استوعبت محتوى الإنترنت.
اقرأ أيضاً: ما هي إصدارات نماذج التفكير في بوتات الدردشة؟ وكيف تعمل؟
كيف لنا أن نقيم إنجازات أكسيوم؟ ليس عبر وسائل التواصل الاجتماعي، على الأقل. والفوز اللافت للنظر بالمسابقات ليس سوى البداية. وتحديد مدى براعة النماذج اللغوية الكبيرة في الرياضيات سيتطلب دراسة معمقة لما تفعله هذه النماذج بالضبط عندما تحل المسائل الرياضية المعقدة (أي الصعبة بالنسبة للبشر).