أعلنت أوبن أيه آي عن نموذجها اللغوي الأحدث والأكثر تقدماً "جي بي تي-4 أو" (GPT-4o)، الذي يشكّل قفزة كبيرة في تطوير الذكاء الاصطناعي، ويقدّم تحسينات كبيرة مقارنة بنماذج جي بي تي السابقة مثل جي بي تي 3 و جي بي تي 4، وستُطرَح ميزاته الجديدة للمستخدمين جميعهم تباعاً خلال الأسابيع القليلة المقبلة مجاناً.
اقرأ أيضا: إليك ما يجب أن تعرفه عن «تشات جي بي تي- 4 أو» الجديد من أوبن أيه آي وكيف تستفيد من الميزات الجديدة
جي بي تي 4 أو: النموذج الشامل
قادت ميرا موراتي، الرئيس التنفيذي للتكنولوجيا (CTO) في أوبن أيه آي العرض المباشر للإصدار الجديد جي بي تي-4 أو، وأوضحت خلاله قدرات النموذج الذي أطلقت عليه اسم "النموذج الشامل"، لكونه يقدّم استجابات أسرع وانتقالات أكثر سلاسة بين المهام من مكانٍ واحد، على عكس جي بي تي 4 ذي النماذج المنفصلة التي تحتاج إلى أوقات استجابة أطول وتكاليف حوسبة أعلى. والنتيجة، كما يوحي العرض الذي قدّمته الشركة، هي مساعد محادثة قادر على الاستجابة لمطالبات معقدة بسلاسة.
يشير GPT-4o إلى "Generative Pre-trained Transformer 4 omni"، وتشير كلمة "omni" إلى قدراته المتعددة الوسائط لمعالجة وإنشاء النصوص والصور والصوت والفيديو بطريقة متكاملة.
ميزات جي بي تي-4 أو
بالإضافة إلى القدرات المتعددة الوسائط، يتميز جي بي تي-4 أو بزيادة الكفاءة والسرعة (ضعف سرعة جي بي تي 4)، والتكلفة الأقل بنسبة 50% لمشتركي الخطط المدفوعة، وسهولة الاستخدام على نطاقٍ أوسع عبر التطبيقات المختلفة، وقاعدة معرفية أكبر، وحجم نموذج أكبر مع المزيد من المعلمات، ومجموعة بيانات تدريب أوسع، ما يعزز قدرته على التعامل مع المهام اللغوية المعقدة.
يستطيع جي بي تي-4 أو فهم وإنشاء تعليمات واستجابات معقدة عبر طرق مختلفة، ما يجعله أداة قوية للبحث والتطبيقات العملية في مجالات مثل خدمة العملاء والرعاية الصحية والتعليم. وقد يمثّل بداية حقبة جديدة في الذكاء الاصطناعي والتفاعل البشري، مع القدرة على فهم المدخلات المتعددة الوسائط والاستجابة لها في الوقت الفعلي، على غرار المحادثة البشرية، إذ يمكنه الاستجابة للمدخلات الصوتية في أقل من 232 مللي ثانية، بمتوسط 320 مللي ثانية، وهو ما يشبه وقت الاستجابة البشرية في محادثة.
يتميز أيضاً بسهولة المحادثة الحية، إذ يمكن مقاطعة النموذج في أثناء استجاباته، فيتوقف ويستمع ويعدّل المسار، كما أظهر القدرة على تغيير نبرة الصوت وتغيير سرعة الكلام بناءً على طلب المستخدم.
تعمل كل من الخوارزمية والبنية التحتية المحسّنة على جعل النموذج أكثر كفاءة في استخدام الطاقة وتقليل المتطلبات الحسابية، وهو أمر مهم للاعتبارات البيئية واعتبارات التكلفة.
اقرأ أيضاً: أوبن أيه آي تُطلق «جي بي تي-4 تربو» وتسمح بتطوير بوتات متخصصة
خلال الأسابيع القليلة المقبلة، سيصبح بإمكان المستخدمين جميعهم الوصول إلى جي بي تي-4 أو مجاناً من خلال تطبيق جي بي تي وواجهة الويب، بعدد محدد من المطالبات. وعند الوصول إلى الحد الأقصى، سيتحول ChatGPT تلقائياً إلى GPT-3.5 حتى يتمكن المستخدمون من مواصلة محادثاتهم. أمّا المشتركون في الخطط المدفوعة، سيتمكنون من الوصول إلى خمسة أضعاف الطلبات، وسيحصلون على ميزات أكثر.
بيانات التدريب
تعود ميزات النموذج إلى بيانات التدريب، فقد دُرِّب على كمية هائلة من النصوص التي تغطي مجموعة واسعة من المواضيع والأنماط، باستخدام مليارات الكلمات من مصادر مختلفة، بما في ذلك الكتب والمقالات والمواقع الإلكترونية. تضمن هذه البيانات الشاملة أن النموذج يمكنه فهم وإنشاء نص متنوع ودقيق.
اعتمد تدريب النموذج على استخدام التعلم الموجَّه والضبط الدقيق، والتعلم العميق، والتقييم المستمر في عملية التدريب لضمان الأداء العالي. وراعت أوبن أيه آي الحد من التحيزات في بيانات وأساليب التدريب، وتحسين موثوقية النموذج وأخلاقياته.
اقرأ أيضاً: ما هو «جي بي تي-4»؟ ولماذا قد يمثّل علامة فارقة في تاريخ الذكاء الاصطناعي؟
القدرات المحتملة لجي بي تي-4 أو
بحسب ما ورد في إعلان أوبن أيه آي، يتمتّع جي بي تي-4 أو بقدرات تشمل:
التكامل المتعدد الوسائط
يتمتّع جي بي تي-4 أو بقدرات متقدمة متعددة الوسائط تسمح له بمعالجة وإنشاء أنواع مختلفة من البيانات، بما في ذلك النصوص والصور والصوت؛ إذ يمكنه فهم وإنشاء نص يشبه ما يُنشئه الإنسان لمختلف المهام مثل الكتابة والتحليل وما إلى ذلك، بالإضافة إلى تحسين فهم اللغة عبر لغات متعددة (50 لغة)، وإنشاء مخرجات صوتية مثل تركيب الكلام أو الموسيقى أو الغناء وتنسيقات الصوت الأخرى بناءً على مدخلات النص.
يتمثل التقدم الرئيسي في قدرة جي بي تي-4 أو على الجمع بين الطرق المختلفة ومعالجتها معاً بسلاسة، إذ يمكنه قبول المدخلات في أي مجموعة من النصوص والصور والصوت، وإنشاء مخرجات بالتنسيق (التنسيقات) المطلوب، ما يسمح بتفاعل أكثر طبيعية بين الإنسان والحاسوب من خلال فهم الاستفسارات المتعددة الوسائط والرد عليها.
إنشاء المحتوى والكتابة
تسمح قدراته المتقدمة المتعددة اللغات والصوتية والبصرية بإنشاء محتوى متعدد الوسائط متنوع وغني وجذاب وسهل القراءة، بسرعة وجودة عالية، فقد يمكن لجي بي تي-4 أو إنشاء محتوى مكتوب إبداعي عالي الجودة مثل المقالات والقصص والنصوص والكتابة التسويقية، بما في ذلك المقالات وأوصاف المنتجات ومنشورات المدونات والصفحات المقصودة ونسخ الإعلانات وتحديثات الوسائط الاجتماعية والمزيد.
المساعدة على البرمجة
يمكن لجي بي تي-4 أو مساعدة المطورين من خلال إنشاء التعليمات البرمجية، وشرح وظائفها، وكتابة البرامج بأكملها، ما يمكن أن يحسّن الإنتاجية والكفاءة بشكلٍ كبير في تطوير البرمجيات.
الترجمة والدعم المتعدد اللغات
تمتد القدرات اللغوية لجي بي تي-4 أو إلى الترجمة الدقيقة بين لغات متعددة، فهو يقدّم خدمات الترجمة في الوقت الفعلي وإنشاء محتوى متعدد اللغات وتطبيقات تعلم اللغة.
خدمة العملاء
تسمح قدرات جي بي تي-4 أو متعددة الوسائط بفهم استفسارات العملاء والرد عليها من خلال النصوص والصور والصوت، وهذا يجعلها مناسبة لبناء بوتات دردشة متطورة لدعم العملاء.
التعليم والدروس الخصوصية
يمكن أن يعمل جي بي تي-4 أو مدرساً افتراضياً يشرح المفاهيم المعقدة، ويجيب عن الأسئلة، ويوفّر موارد تعليمية لمواضيع مختلفة. وتمكّنه قدراته المتعددة الوسائط من فهم وإنشاء المساعدات البصرية، وإرشاد المستخدم كما يفعل المعلم، ما يجعله أداة تعليمية قوية.
تحليل البيانات وتمثيلها
بفضل قدرته على معالجة وإنشاء النصوص والصور والبيانات، يمكن استخدام جي بي تي-4 أو في مهام تحليل البيانات وتفسيرها وتمثيلها، ويمكنه توليد رؤى وتقديمها بطريقة واضحة ومفهومة.
الرعاية الصحية والمساعدة الطبية
إن فهم اللغة في جي بي تي-4 أو وإمكانات الوسائط المتعددة تجعله مفيداً في تطبيقات الرعاية الصحية، مثل المساعدة على التشخيص الطبي وتوصيات العلاج وتثقيف المرضى.
مساعدة ضعاف البصر
يساعد جي بي تي-4 أو على إيضاح ماهية الأشياء الموجودة أمامه، والتي يصوّرها عبر كاميرا الهاتف الخاص به، ما يجعل منه أداة ثمينة لشخص يعاني ضعف البصر أو حتى فقدان البصر.
اقرأ أيضاً: ما هو أوتو جي بي تي (Auto-GPT) وبمَ يختلف عن تشات جي بي تي (ChatGPT)؟
الأمان والسلامة
يحتوي جي بي تي-4 أو على تدابير أمان مدمجة، تشمل تصفية بيانات التدريب وتحسين سلوك النموذج. وتوفّر أنظمة السلامة الجديدة حواجز حماية على المخرجات الصوتية.
بالإضافة إلى ذلك، أُجريت تقييمات تغطي الأمن السيبراني، والمواد الكيميائية والبيولوجية والإشعاعية والنووية، ومخاطر الاستقلالية النموذجية، كما خضع جي بي تي 4 أو لفريق خارجي يتكون من أكثر من 70 خبيراً في مجالات مثل علم النفس الاجتماعي والتحيز والإنصاف والمعلومات المضللة ليتمتّع بأكبر قدر ممكن من الأمان والسلامة.
كانت هذه التطبيقات والقدرات المحتملة التي يتمتّع بها جي بي تي 4 أو حسب العرض الذي قدّمته أوبن أيه آي، والتي ستزوّد المستخدمين بها خلال الأسابيع المقبلة، التي قد تكشف عن قدرات أكبر أو عقبات محتملة.