ما هي إصدارات نماذج التفكير في بوتات الدردشة؟ وكيف تعمل؟

5 دقيقة
كيف تحمي بياناتك الشخصية عند استخدام تطبيقات اللياقة البدنية؟
حقوق الصورة: shutterstock.com/Summit Art Creations

قطعت نماذج اللغة الكبيرة أشواطاً طويلة منذ ظهورها بصورتها الحديثة التي أسهمت في ظهور بوت الدردشة تشات جي بي تي، حيث انتقلت من مربع يوفّر إجابات سريعة بتنسيق مُدرّبة عليه مسبقاً إلى مرحلة التفكير البطيء، من خلال اتباع خطوات أكثر تسلسلاً عند الإجابة عن المطالبات، بداية من تجربة طرق مختلفة ثم اختيار أفضل الأساليب ثم رفض الأساليب غير الصالحة، وأخيراً اختيار أفضل إجابة بطريقة مشابهة للبشر عند التفكير في الإجابة عن الأسئلة.

حيث يُعدُّ التحول من الإجابات السريعة إلى الإجابات المدروسة بقوة التفكير المنطقي العصا السحرية التي تراهن عليها شركات الذكاء الاصطناعي لتغيير قواعد اللعبة، وفتح الباب واسعاً لتطبيقات الذكاء الاصطناعي الوكيل التي يمكنها التعامل مع تعقيدات العالم الحقيقي.

لذلك نجد في الوقت الراهن أن شركات الذكاء الاصطناعي التي لديها بوتات دردشة مدعومة بالذكاء الاصطناعي التوليدي لديها إصدارات أكثر تقدماً تستخدم المنطق الاستدلالي في تقديم إجاباتها، وهو ما يطرح أسئلة عميقة حول كيفية عمل هذه النماذج الأكثر تقدماً؟ ولماذا أصبحت شركات الذكاء الاصطناعي أكثر تركيزاً عليها؟ ولماذا تعمل كل شركة على التباهي بقوة نموذجها؟

ما هي إصدارات نماذج التفكير في الذكاء الاصطناعي؟ وكيف تعمل؟

نماذج التفكير التوليدي هي نوع جديد من النماذج اللغوية الكبيرة المصممة لأداء مهام التفكير المعقدة، من خلال الجمع بين قدرات الذكاء الاصطناعي التوليدي وتقنيات التفكير المتقدمة، وتُدرَّب باستخدام تقنيات التعلم المعزز للتفكير قبل الإجابة، ما ينتج عنه سلسلة داخلية طويلة من عمليات التفكير لحل المشكلات بشكلٍ أكثر فاعلية. وتشمل السمات الرئيسية لنماذج التفكير التوليدي ما يلي:

  • تقسيم المشكلات المعقدة إلى خطوات وشرح كيفية التوصل إلى الإجابة بطريقة تدريجية.
  • التعامل بكفاءة مع المهام التي تتطلب معالجة منطقية مثل إنشاء الأكواد البرمجية والتفكير العلمي والتخطيط متعدد الخطوات.
  • على الرغم من محدوديتها إلى حد ما مقارنة بنماذج الذكاء الاصطناعي الأخرى، فإن النماذج المنطقية لا يزال بإمكانها التعلم وتحسين أدائها بمرور الوقت.
  • بعض النماذج مصممة للتعامل مع مهام الاستدلال المعقدة مع تقديم تفسيرات مفصلة لعمليات التفكير الخاصة بها.

جدير بالذكر أن نماذج التفكير تتطلب عادةً قوة حوسبة مضاعفة لتحقيق الأداء المطلوب لمعالجة البيانات وتحليلها بالسرعة والدقة المناسبتين، بسبب حاجتها إلى التعامل مع كميات هائلة من البيانات في وقت أقل وتحسين دقتها في فهم السياقات المعقدة، لذلك نجد أن معظم هذه الإصدارات تأتي ضمن الخطة المدفوعة لبوتات الدردشة التي تطوّرها شركات الذكاء الاصطناعي.

اقرأ أيضاً: ما هي المهن التي لن يحل محلها الذكاء الاصطناعي التوليدي؟

لماذا تعمل كل شركة ذكاء اصطناعي على التباهي بقوة نموذج التفكير الخاص بها؟

على الرغم من أن شركة إكس أيه آي (xAI) من الشركات التي دخلت متأخرة سوق نماذج الذكاء الاصطناعي التوليدي، فإن مؤسسها رائد الأعمال إيلون لا يتوانى في التباهي بقوة نموذج بوت الدردشة غروك 3 (Grok 3)، وهو ما يلقي الكثير من التشكيك من الباحثين الذين اكتشفوا العديد من أوجه القصور في عمله، ومع ذلك فإن موجة تفاخر شركات الذكاء الاصطناعي بقوة نماذج التفكير الخاصة بها يبدو أنها لن تهدأ في القريب العاجل.

ويأتي استعراض شركات الذكاء الاصطناعي لقوة نماذجها بصورة أساسية لتمييز نفسها في سوق مزدحمة وتنافسية للغاية، حيث أصبحت هذه الشركات أكثر حرصاً على تسليط الضوء على قدرة أنظمتها على التفكير أو التكيُّف، والهدف هو وضع تقنياتها كحلول متطورة لمشكلات العالم الحقيقي.

ويتوافق هذا السرد أيضاً مع طموحات شركات الذكاء الاصطناعي الكبيرة في الوصول إلى الذكاء الاصطناعي العام، والذي ستضمن الشركة التي تصل إليه تربعها على عرش ريادة صناعة الذكاء الاصطناعي دون شك.

اقرأ أيضاً: وعود شركات الذكاء الاصطناعي: هل هي حقيقة أمْ مبالغات تسويقية؟

مقارنة بين إصدارات نماذج التفكير التوليدي للذكاء الاصطناعي المتوفرة الآن

حتى الآن عملت كل شركة ذكاء اصطناعي لديها بوت دردشة مدعوم بالذكاء الاصطناعي التوليدي على إصدار نسخة مخصصة من نموذج التفكير المنطقي الخاص بها، وقدراتها غالباً هي ما تذكرها الشركة المطورة نفسها خاصة للنماذج مغلقة المصدر، ومع ذلك فإن كل نموذج لديه نقاط قوة وضعف يتميز بها، وهي:

نموذج أوبن أيه آي أو 1 (o1)

  • يستخدم منهجية التفكير المتسلسل قبل تقديم إجابة، ما يسمح له بتقسيم المشكلات المعقدة إلى خطوات أصغر يمكن إدارتها.
  • يمكنه التفكير فترة أطول واستكشاف المزيد من الاحتمالات، من خلال تخصيص المزيد من الموارد لمرحلة الاستدلال، ما يؤدي إلى استجابات أكثر دقة وموثوقية.
  • يتفوق في مجالات العلوم والتكنولوجيا والهندسة والرياضيات وإنشاء الأكواد البرمجية والاستدلال العلمي.

نقاط الضعف:

  • يخفي سلسلة التفكير الفعلية، ما يجعل من الصعب قياس المدة التي استغرقها في الإجابة أو فهم كيفية وصوله إلى الاستنتاج.
  • لاحظ الخبراء أن النموذج غير مفضل لبعض مهام اللغة الطبيعية مثل الكتابة الإبداعية.
  • توجد صعوبات مع أسئلة المنطق الأساسية واحتمالية ارتكابه الأخطاء في مهام مثل عد الكلمات أو سرد الحالات.

اقرأ أيضاً: هل اقتربت شركة أوبن أيه آي من تطوير الذكاء الاصطناعي العام؟

نموذج جيميناي 2.0 فلاش ثينكينغ (Gemini 2.0 Flash Thinking)

  • القدرة على معالجة كل من النصوص والصور كمدخلات، ما يسمح له بالتعامل مع المهام التي تتطلب سياقاً مرئياً مثل تفسير المخططات أو تحليلها.
  • تقسيم الأسئلة المعقدة إلى خطوات أصغر ويُظهر عملية تفكيره ويشرح استنتاجاته بطريقة منظمة، ما يعزّز ثقة المستخدم وفهمه عملية صُنع القرار.
  • دعم نافذة سياق تصل إلى مليون رمز للإدخال، ويمكنه إنشاء استجابات تصل إلى 64 ألف رمز، ما يُمكّنه من تحليل النصوص الطويلة مثل الكتب أو محادثات الاجتماعات المطولة.

نقاط الضعف:

  • عند مواجهة سيناريوهات معدّلة أو جديدة، يميلُ إلى الاعتماد بشكلٍ كبير على معرفته السابقة بدلاً من التكيُّف مع المتطلبات المحددة للمشكلة المطروحة.
  • يميلُ إلى الهلوسة بشكلٍ مفرط عند التعامل مع نوافذ السياق التي تتجاوز 200 ألف رمز.
  • يواجه صعوبة في دمج التفاصيل المعدّلة أو التكيُّف مع التغييرات الطفيفة في سيناريوهات المشكلة، ما يُظهِر مرونة محدودة في تفكيره.

نموذج آر 1 (R1)

  • يختار بشكلٍ ديناميكي الخبراء الذين سيتم تنشيطهم بناءً على المدخلات، ما يضمن القدرة على التكيُّف عبر المهام والمجالات المختلفة.
  • يتفوق في مهام التفكير من خلال تنفيذ سلسلة من عمليات التفكير دون مطالبة صريحة، ما يعزّز مهارات المعالجة المنطقية وحل المشكلات.
  • يمكنه التعامل مع ما يصل إلى 128 ألف رمز من سياق الإدخال، ما يجعله مثالياً لمهام التفكير المعقدة وتحليل المحتوى الطويل.

نقاط الضعف:

  • يخلط أحياناً بين الاستجابات الإنجليزية والصينية بسبب نقص الضبط الدقيق الخاضع للإشراف.
  • لديه درجة مخاطر وفقاً لمعيار (AppSOC) تبلغ 8.3 من 10، مع درجات عالية بشكلٍ خاص في مخاطر الأمان بنسبة 9.8 ومخاطر الامتثال بنسبة 9.0.

اقرأ أيضاً: كيف تمكنت شركة «ديب سيك» من تحدي عمالقة الذكاء الاصطناعي بأقل الموارد؟

نموذج كلود 3.7 سونيت (Claude 3.7 Sonnet)

  • ينخرط وضع التفكير الموسع في الاستدلال خطوة بخطوة بشكلٍ متعمق لحل المشكلات المعقدة، ما يسمح بتحليل المشكلات بشكلٍ أكثر شمولاً وفقاً لوجهات نظر متعددة.
  • يدعم ما يصل إلى 128 ألف رمز إخراج، ما يوسّع بشكلٍ كبير قدرته على توليد استجابات مفصلة.
  • يمكن للمستخدم التحكم في وقت تفكيره، ما يسمح بالتوازن بين السرعة وجودة الاستجابة.

نقاط الضعف:

نموذج غروك 3 (Grok 3)

  • مصمم بقدرات استدلال متقدمة بما في ذلك القدرة على تشغيل سلاسل فكرية متعددة وتصحيح ذاتي وتقييم الحلول قبل الانتهاء من الإجابة.
  • وجود وضع متخصص يستخدم موارد حوسبة إضافية لتحسين قدراته على التفكير وحل المشكلات المعقدة بطريقة متعددة الخطوات.
  • معالجة اتجاهات السوق وتفسيرها في الوقت الفعلي واستخلاص رؤى من البيانات العامة على منصة إكس والمصادر الأخرى.

نقاط الضعف:

اقرأ أيضاً: «تشات جي بي تي» مقابل «غروك»: أيّهما يناسب احتياجاتك؟

ما هي أبرز التحديات التي تواجه نماذج التفكير التوليدي للذكاء الاصطناعي؟

  • اعتمادها بشكلٍ كبير على جودة بيانات التدريب وتنوعها، حيث يمكن أن يؤدي انخفاض جودة البيانات إلى مخرجات غير دقيقة أو متحيزة.
  • غالباً ما تُكافح في تفسير سيناريوهات المطالبات الدقيقة أو الغامضة أو الخاصة بالسياق، ما يؤدي إلى إنشاء استجابات غير ذات صلة.
  • من الصعب فهم كيفية وصولها إلى الاستجابة للمطالبة، ما يجعل من الصعب الوثوق بها أو تبرير عمليات التفكير وقراراتها.
  • تدريبها وتشغيلها يتطلب موارد حاسوبية كبيرة، ما يؤدي إلى زيادة التكاليف ما ينعكس بدوره على المستخدم النهائي في خطة الاشتراك الشهرية.
  • التفكير الخاطئ قد يؤدي إلى قرارات غير أخلاقية أو غير مقصودة لا سيما في الصناعات الحساسة مثل الرعاية الصحية والتمويل والقانون.

المحتوى محمي