الرجاء تفعيل الجافاسكربت في متصفحك ليعمل الموقع بشكل صحيح.

كيف تمكنت شركة «ديب سيك» من تحدي عمالقة الذكاء الاصطناعي بأقل الموارد؟

5 دقيقة
نموذج "آر 1" الذي طوّرته شركة "ديب سيك" يبهر مجتمع الذكاء الاصطناعي
حقوق الصورة: shutterstock.com/Poetra.RH

كشفت شركة ديب سيك (DeepSeek) الصينية، الأسبوع الماضي، عن نموذج ذكاء اصطناعي جديد يحمل اسم "آر 1" (R1) ، وهو نموذج مصمم خصيصاً لمهام الاستدلال. قد يبدو هذا خبراً عادياً لا يستدعي الاهتمام، فشركات التكنولوجيا الكبرى والناشئة تُطلق العديد من نماذج الذكاء الاصطناعي كل عام. لكن الكشف عن هذا النموذج كان مفاجئاً لمجتمع الذكاء الاصطناعي لعدة أسباب؛ أبرزها أن نموذج "آر 1" ينافس ويتفوق في جوانب معينة على أداء نموذج أو 1 (o1)، الذي يُعدّ أقوى نموذج أطلقته شركة "أوبن أيه آي" حتى الآن، لكنه يحقق هذا الأداء بتكلفة أقل بنسبة تتراوح بين 90% و95%. إضافة إلى ذلك، فإن نماذج "ديب سيك" بشكلٍ عام مفتوحة المصدر، بخلاف معظم النماذج القوية التي تطوّرها الشركات الكبرى وتبقيها حصرية.

عقب إطلاق هذا النموذج، سادت حالة من القلق في وادي السيليكون وصلت إلى التساؤل حول ما إذا كانت نماذج الذكاء الاصطناعي المتقدمة التي تُطلقها "ديب سيك" ستمثّل تهديداً لمكانة الولايات المتحدة في هذا المجال، لا سيما وأن الشركة تبدو قادرة على تطوير هذه النماذج بتكلفة منخفضة واعتماداً على شرائح أقل قوة.

والسؤال المطروح الآن: كيف تمكنت هذه الشركة الصينية، التي لم تكن معروفة حتى وقت قريب، من تحقيق هذا الإنجاز خلال فترة زمنية قصيرة؟

اقرأ أيضاً: لماذا أطلق دونالد ترامب عملته الرقمية؟ إليك القصة الكاملة وراء عملة TRUMB$

خطوة ثورية: الانتقال من الضبط الدقيق الخاضع للإشراف إلى التعلم المعزز

في نوفمبر الماضي، قالت "ديب سيك" إنها حققت إنجازاً مهماً وإن نموذجها "آر 1" تفوق على نموذج الاستدلال "أو 1" (o1) في مهام الرياضيات والبرمجة والاستدلال، لكن الشركة لم تُطلق آنذاك سوى نموذج محدود تحت اسم (R1-lite-preview). ومع ذلك، فقد جذبت الانتباه إليها بشدة الأسبوع الماضي، بعد إطلاق سلسلة نماذج كاملة تحمل اسم "ديب سيك-آر1" (DeepSeek-R1). وتتضمن السلسلة نموذجين هما "آر 1" (R1) و"آر 1-زيرو" (R1-Zero).

كما نشرت "ديب سيك" الورقة الفنية الخاصة بنماذجها، حيث كشفت فيها عن الأسلوب المبتكر الذي استخدمته لتحقيق هذا الإنجاز: التخلي عن عملية الضبط الدقيق الخاضع للإشراف (SFT) -التي يُشار إليها أحياناً باسم سلسلة الأفكار (CoT)- وهي الطريقة المستخدمة عادة في تدريب النماذج اللغوية الكبيرة (LLMs) على تحسين قدرات التفكير.

بدلاً من ذلك، اختارت الشركة تدريب نموذجها باستخدام طريقة التعلم المعزز (RL)، التي تعتمد على مبدأ المكافأة والعقاب. ويشرح باحثو الشركة في ورقتهم الفنية كيف بدؤوا بتدريب النموذج الوسيط "آر 1-زيرو" على التفكير باستخدام "التعلم المعزز" فقط. وقد أسفر هذا النهج عن نتيجة غير متوقعة: بدأ النموذج بتخصيص وقت معالجة إضافي للمشكلات الأكثر تعقيداً، وهو ما اعتبره الباحثون "لحظة الاكتشاف" (aha moment) التي استطاع فيها النموذج تحديد حلول مبتكرة للمشكلات المعقدة وصياغتها.

ولتلافي بعض العيوب التي ظهرت في النموذج الوسيط، مثل الخلط بين اللغات، قرر الباحثون تطوير نموذج جديد يحمل اسم "آر 1". وقد اعتمد هذا النموذج أيضاً على طريقة "التعلم المعزز"، مع إدخال قدر محدود من "الضبط الدقيق الخاضع للإشراف" في المراحل النهائية من تطوير النموذج. الفكرة الأساسية التي أثبتتها الشركة في نهاية المطاف هي أن تقنية التعلم المعزز وحدها يمكن أن تحقق تحسينات كبيرة في الأداء.

نتائج عكسية للقيود الأميركية

قبل هذا الإعلان الأخير، كانت الشركة أطلقت في نهاية ديسمبر الماضي نموذجاً لغوياً كبيراً مفتوحَ المصدر تحت اسم ديب سيك في 3 (DeepSeek V3)، وأوضحت أنها طوّرته باستخدام بنية مزيج من الخبراء (Mixture of Experts (MoE))، التي تهدف إلى تقليل التكاليف من خلال تنشيط الشبكات العصبونية اللازمة فقط لمعالجة استفسار معين بدلاً من تشغيل النموذج بأكمله. وأضافت أن عملية التطوير استغرقت شهرين فقط وبتكلفة لم تتجاوز 6 ملايين دولار، معتمدة على رقائق (H800s) التي تصممها شركة إنفيديا.

يشير استخدام هذه الرقائق ذات القدرات المنخفضة نسبياً إلى أن "ديب سيك" تعمل في ظل تحديات تفرضها القيود الأميركية المتزايدة على تصدير الرقائق المتقدمة إلى الصين. ومع ذلك، تشير الأدلة الأولية إلى أن هذه القيود لم تحقق هدفها المتمثل في إضعاف قدرات الصين في مجال الذكاء الاصطناعي، وإنما أسهمت في دفع شركات ناشئة مثل "ديب سيك" إلى التركيز على الابتكار بطرق تعزز الكفاءة، وإعادة تصميم عمليات التدريب لتقليل الضغط على وحدات معالجة الرسوميات الخاصة بها التي يبلغ أداؤها نصف سرعة أفضل منتجات إنفيديا، التي تستخدمها شركات مثل "أوبن أيه آي" ومايكروسوفت وجوجل.

اقرأ أيضاً: لماذا يمثّل النموذج «أو 3» إنجازاً مهماً في الطريق نحو الذكاء الاصطناعي العام؟

ما الذي يُميّز "آر 1"؟

يمثّل نموذج "آر 1" مؤشراً واضحاً على تقلص الفجوة بين النماذج المفتوحة والنماذج التجارية المغلقة في سباق الوصول إلى الذكاء الاصطناعي العام.

إلى جانب كونه نموذجاً مفتوحَ المصدر، ما يخفف من المخاوف بشأن الخصوصية والأمان، يتميز "آر 1" أيضاً بأنه مجاني للاستخدام عبر تطبيق ويب، كما أن تكلفة استخدام واجهة برمجة التطبيقات الخاصة به منخفضة للغاية (0.14 دولار لكل مليون رمز إدخال، مقارنة بـ 7.5 دولارات لنموذج "أو 1").

ولإثبات قوة نموذجها، استخدمت الشركة "آر1" لتحسين أداء 6 نماذج أخرى من سلسلتي لاما (Llama) وكوين (Qwen)، ما رفع كفاءتها إلى مستويات جديدة. في إحدى الحالات، تفوق النموذج المحسن من نموذج كوين-1.5 بي (Qwen-1.5B) على نماذج أكبر مثل "جي بي تي-4 أو" و"كلود 3.5 سونيت" في اختبارات رياضية محددة.

وقد أتاحت "ديب سيك" النماذج المحسنة، بالإضافة إلى النموذج الرئيسي "آر-1"، في إصدارات مفتوحة المصدر، وهي متاحة الآن على منصة "هاغينيغ فيس". وسرعان ما اكتسب "آر 1" شعبية كبيرة بين الباحثين والمطورين، وأصبح النموذج الأكثر تحميلاً على المنصة، مع وصول عدد مرات التحميل إلى 131 ألف مرة حتى الآن. كما يشير المستخدمون إلى أن ميزة البحث المرافقة للنموذج، والمتوفرة عبر موقع "ديب سيك"، تتفوق على ميزة البحث لدى المنافسين بما في ذلك "أوبن أيه آي" و"بريبلكستي"، ولا ينافسها سوى ميزة (Gemini Deep Research) الخاصة شركة جوجل.

خسائر محتملة للشركات الكبرى

يتوقع الرئيس التنفيذي ورئيس تحرير موقع "فينتشربيت"، مات مارشال، في مقاله المفصّل حول نماذج "ديب سيك، أن تؤدي الحلول التي طوّرتها الشركة إلى خفض تكلفة استخدام هذه النماذج إلى ما يقارب الصفر (باستثناء تكاليف التشغيل في أثناء الاستدلال). والمفارقة أن جودة الأداء التي تحققها نماذج هذه الشركة باستخدام جزء بسيط من التكلفة التي تحتاج إليها الشركات المنافسة قد يسبب خسائر فادحة لشركات الذكاء الاصطناعي الرائدة التي استثمرت مبالغ كبيرة في البنية التحتية الحصرية، كما يُثير تساؤلات حول قدرة شركات مثل "أوبن أيه آي" على تحقيق عوائد على استثماراتها الضخمة.

ولا يقتصر التهديد الصيني على "ديب سيك" فقط، فقد أعلنت شركة "بايت دانس"، مالكة تطبيق "تيك توك"، تحديثاً جديداً لنموذج الذكاء الاصطناعي الرئيسي الخاص بها، تحت اسم دوباو 1.5 برو (Doubao-1.5-pro)، وصرّحت الشركة بأن النموذج الجديد يتفوق على "أو 1" في اختبار (AIME)، وهو معيار يقيس قدرة النماذج على فهم التعليمات المعقدة والاستجابة لها بفاعلية، كما كشفت شركات صينية أخرى، مثل مونشوت أيه آي (Moonshot AI) ومينيمكس (Minimax) وآي فلاي تيك (iFlyTek)، خلال الأسابيع القليلة الماضية، عن نماذجها الخاصة للاستدلال، ما يعكس التنافس المتزايد في قطاع الذكاء الاصطناعي في الصين.

اقرأ أيضاً: كيف يمكن بناء نموذج ذكاء اصطناعي لكشف المحتوى المسيء؟

على الجانب الآخر: إنجاز مذهل وهدية للعالم

رغم التنافس الشديد، لا ينظر الجميع في الولايات المتحدة إلى شركة "ديب سيك" باعتبارها مصدر تهديد. في منشور على منصة "إكس"، قال المستثمر والشريك في شركة رأس المال المغامر أندريسن هورويتز (a16z)، مارك أندريسن، إن "نموذج آر 1 هو أحد أكثر الإنجازات المذهلة والمثيرة للإعجاب التي رأيتها على الإطلاق. وكونه مفتوحَ المصدر، فهو هدية قيمة للعالم".

من جانبه، يعتقد كبير علماء الذكاء الاصطناعي في شركة ميتا، يان لوكون، أن أهمية نماذج "ديب سيك" لا تكمن في تفوق الصين على أميركا، وإنما في "تفوق النماذج المفتوحة المصدر على النماذج الحصرية". وأضاف في منشور على منصة "ثريدز"، أن "ديب سيك استفادت من الأبحاث المفتوحة والمصادر المفتوحة، مثل مكتبة باي تورش (PyTorch) ونماذج لاما التي طوّرتها ميتا. وتوصلت الشركة إلى أفكار جديدة وبنتها استناداً إلى أعمال الآخرين، ومع نشر أعمالها كمصدر مفتوح، يمكن للجميع الاستفادة منها. هذه هي قوة الأبحاث والمصادر المفتوحة".

يذكر أن النماذج التي طوّرتها شركة ميتا ضمن سلسة "لاما" هي أيضاً نماذج مفتوحة المصدر، وهو نهج تدافع عنه الشركة منذ فترة طويلة. وفي تدوينة نشرها لوكون أمس على منصة "إكس"، دافع مرة أخرى عن نهج المصدر المفتوح، قائلاً إن الفكرة هي أن الجميع يستفيدون من أفكار الآخرين. لا أحد "يتفوق" على الآخر، ولا دولة "تخسر" أمام دولة أخرى، ولا أحد يحتكر الأفكار الجيدة.

المحتوى محمي