أدخلت شركة الذكاء الاصطناعي الناشئة أوبن أيه آي (OpenAI)، خلال الأيام القليلة الماضية، مجموعة كبيرة من التحديثات على بوت الدردشة الأشهر في العالم حالياً "تشات جي بي تي"، من بينها توصيله مباشرةً بالإنترنت، وتحسين قدراته بأدوات مساعدة جديدة مثل نموذج "دال إي-3"، وذلك لتعزيز صورته باعتباره أداة للذكاء الاصطناعي التوليدي متعددة القدرات.
تشات جي بي تي يتصفح الإنترنت
قالت "أوبن أيه آي"، في تغريدة على حسابها على منصة إكس (تويتر سابقاً)، إن الإصدارين المدفوعين "تشات جي بي تي بلس" و"تشات جي بي تي إنتربرايز" يمكنهما الآن تصفح الويب، ما يُتيح للمستخدمين الوصول إلى المزيد من البيانات في الوقت الفعلي.
قبل ذلك، كانت البيانات التي تدرب البوت عليها ويمكنه الإجابة وفقاً لها تتوقف عند شهر سبتمبر/ أيلول 2021؛ بمعنى أن معرفته كانت مقتصرة على التواريخ والأحداث التي وقعت قبل هذا التاريخ.
تعني هذه الخطوة أن بعض المستخدمين سيكونون قادرين على طرح الأسئلة على البوت حول الشؤون الجارية، والوصول إلى "المعلومات الحالية والموثوقة، مع توفير روابط مباشرة للمصادر"، على حد قول الشركة التي أوضحت أنها ستُتيح هذه الميزة للمزيد من المستخدمين قريباً.
وتشير "أوبن أيه آي" إلى أن التصفح يُعد مفيداً بشكلٍ خاص للمهام التي تتطلب معلومات حديثة، مثل مساعدة المستخدم في الأبحاث التقنية أو التخطيط لقضاء إجازة. ولتمكين هذه الميزة، اختر التصفح باستخدام بينغ (Browse with Bing) تحت مربع جي بي تي-4 (GPT-4).
ChatGPT can now browse the internet to provide you with current and authoritative information, complete with direct links to sources. It is no longer limited to data before September 2021. pic.twitter.com/pyj8a9HWkB
— OpenAI (@OpenAI) September 27, 2023
كانت ميزة تصفح الإنترنت متاحة بالفعل في بوت "بينغ تشات"، الذي أطلقته مايكروسوفت على متصفحها أولاً ثم على نظام التشغيل "ويندوز 11" الأسبوع الماضي، وكذلك الحال بالنسبة لبوت "بارد" الذي طوّرته شركة جوجل، ويوفر كلاهما أيضاً روابط البحث، كما تفعل الآن الميزة الجديدة في "تشات جي بي تي".
كذلك أعلنت شركة ميتا، في مؤتمر ميتا كونكت (Meta Connect) الذي عُقد يوم الخميس الماضي، أنها ستستخدم بينغ أيضاً لتمكين مساعدها الافتراضي الجديد ميتا أيه آي أسيستانت (Meta AI Assistant) من عرض نتائج الويب في الوقت الفعلي. وتُتيح الشركة هذا البوت عبر تطبيقات واتساب وماسنجر وإنستغرام المملوكة لها.
اقرأ أيضاً: أصبح بإمكانك الدردشة الآن مع تشات جي بي تي باستخدام الصوت والصورة
تجربة محفوفة بالمخاطر
كانت أبحاث "أوبن أيه آي" نفسها توصلت إلى نتيجة مفادها أن وصول بوتات الدردشة إلى الإنترنت يُعد أمراً محفوفاً بالمخاطر. في عام 2021، قامت الشركة ببناء نظام تجريبي يُسمَّى ويب جي بي تي (WebGPT) كان يستشهد أحياناً بمصادر غير موثوقة، ويختار البيانات بشكلٍ انتقائي من مواقع الويب التي يعتقد أن المستخدمين سيجدونها مقنعة بغض النظر عما إذا كانت تلك المصادر هي الأكثر مصداقية بالفعل.
وبالمثل، كان بليندربوت 3 (BlenderBot 3.0) الذي طوّرته شركة ميتا، يتمتع بهذه الميزة لكنه سرعان ما انحرف إلى توليد محتوى مسيء ونظريات مؤامرة.
وحتى "تشات جي بي تي" نفسه كان قد اتصل بالإنترنت بشكلٍ تجريبي لفترة وجيزة، بين يومي 27 يونيو/ حزيران و3 يوليو/ تموز الماضيين، من خلال نسخته الموجودة على نظام التشغيل آي أو إس (iOS). لكن الشركة أوقفت هذه الميزة بعدما اكتشف المستخدمون أن بإمكانهم استخدام البوت للوصول إلى المحتوى المدفوع عن طريق تغذيته بعنوان الموقع مباشرة.
ومنذ ذلك الحين، بدأ عنكبوت الويب (Web Crawler) الخاص بـ "أوبن أيه آي" بتعريف نفسه كوكيل مستخدم، حتى تتمكن المواقع من التحكم في كيفية تفاعل البوت معها من خلال تحديثات ملف (Robots.txt) الخاص بها.
اقرأ أيضاً: كيف تستفيد من تشات جي بي تي على محرك بحث بينغ الجديد؟
يرى ويسمع ويتكلم
قبل يومين فقط من توصيله بالإنترنت، أعلنت الشركة عن تحديث رئيسي آخر من شأنه أن يمكّن "تشات جي بي تي" من إجراء محادثات صوتية مع المستخدمين والتفاعل معهم باستخدام الصور، وهو التحديث الأكبر منذ تشغيل الإصدار المدفوع من البوت باستخدام النموذج اللغوي الكبير "جي بي تي-4".
وقالت الشركة في بيان على موقعها الإلكتروني، يوم الاثنين الماضي، إن "تشات جي بي تي" يمكنه الآن أن "يرى ويسمع ويتكلم"، من خلال فهم الكلمات المنطوقة والرد بصوت اصطناعي ومعالجة الصور. ويُتيح التحديث للمستخدمين الانخراط في محادثات صوتية مع تطبيقات "تشات جي بي تي" على الهواتف المحمولة، والاختيار من بين خمسة أصوات اصطناعية مختلفة ليرد البوت من خلالها.
وأوضحت الشركة أن هذه الأصوات الاصطناعية تم إنشاؤها باستخدام أصوات ممثلين صوتيين عملت معهم "أوبن أيه آي" مباشرةً، لتجنب المخاوف المتعلقة بالتزييف العميق.
ويبدو أن هذه الميزات الجديدة هي جزء مما يُعرف باسم جي بي تي فيجن (GPT Vision) أو (GPT-V)، الذي غالباً ما يتم الخلط بينه وبين النموذج الذي لم يصدر بعد جي بي تي-5 (GPT-5).
وأضافت "أوبن أيه آي" أن هذه التغييرات ستكون متاحة لمستخدمي الإصدارات المدفوعة خلال أسبوعين من وقت الإعلان عنها. وفي حين أن الوظائف الصوتية ستقتصر على تطبيقات "أندرويد" و"آي أو إس" فقط، فإن إمكانات معالجة الصور ستكون متاحة على المنصات كلها.
وقد يمثّل هذا الإطلاق خطوة مهمة نحو رؤية الشركة للذكاء الاصطناعي العام الذي يمكنه إدراك المعلومات ومعالجتها بأشكالٍ متعددة بدلاً من الاقتصار على النص.
اقرأ أيضاً: الذكاء الاصطناعي متعدد المهارات: نحو تحسين المحاكاة الحسية لسلوك البشر
دمج "دال إي-3" في "تشات جي بي تي"
هذان الإعلانان الأخيران كانا استكمالاً لسلسة من التحديثات التي شهدها البوت على مدى الأسبوعين الأخيرين. ففي يوم 20 سبتمبر الماضي، أعلنت الشركة إطلاق نموذج توليد الصور دال- إي 3 (DALL-E 3)، ودمجه في "تشات جي بي تي".
يمكن لـ "دال إي-3" إنتاج صور أكثر إقناعاً من إصداريه السابقين، كما يمكنه فهم اللغة الطبيعية على نحو أكثر دقة، وكذلك يستطيع إنشاء صور تتوافق مع الخلفية وسياق الأوامر.
وكما هو الحال بالنسبة لمعظم التحديثات التي أطلقها الشركة مؤخراً، سيكون "دال- إي 3" متاحاً بشكلٍ حصري للمشتركين في "تشات جي بي تي بلس" و"تشات جي بي تي إنتربرايز" خلال الشهر الجاري.
وتستهدف "أوبن أيه آي" من دمج هذا الإصدار الجديد من "دال إي" في "تشات جي بي تي" إلى ترسيخ صورة البوت الخاص بها كمركز للذكاء الاصطناعي التوليدي الذي يمكنه إنتاج النصوص والصور والأصوات والوسائط الرقمية الأخرى بمفرده.
وتقول الشركة إنها ركّزت على توفير تدابير أمان قوية لمنع النموذج من توليد صور يحتمل أن تكون بغيضة، وأوضحت أنها عملت مع "فريق أحمر" خارجي -مجموعة تحاول عمداً اختراق النظام لاختبار سلامته- واعتمدت على أدوات تصنيف المدخلات، وهي طريقة لتعليم النماذج اللغوية تجاهل كلمات معينة لتجنب الأوامر العنيفة أو المضرة.
اقرأ أيضاً: سام ألتمان: هذا ما تعلّمته من نموذج دال- إي 2 (DALL-E 2)
قيمة "أوبن أيه آي" تصل إلى 90 مليار دولار
وسط كل هذه التطورات المتلاحقة، أفادت تقارير إعلامية بأن "أوبن أيه آي" تجري محادثات لاحتمال بيع بعض أسهمها، في خطوةٍ من شأنها أن ترفع تقييم الشركة من 29 مليار دولار في أبريل/ نيسان الماضي إلى ما يتراوح بين 80 و90 مليار دولار حالياً، ما يجعلها واحدة من أكبر الشركات الناشئة من حيث القيمة حول العالم.
ونقلت صحيفة "وول ستريت جورنال" الأميركية عن أشخاص مطلعين على المحادثات قولهم إنه سيتم السماح للموظفين ببيع أسهمهم الحالية بدلاً من إصدار الشركة أسهماً جديدة.
وبالطبع كان "تشات جي بي تي" هو السبب الأول في هذا النجاح السريع للشركة الناشئة، فالبوت الذي لم يمر على إصداره عام واحد كان بمثابة الشرارة التي أشعلت سباق الذكاء الاصطناعي التوليدي بين الشركات الكبرى على مستوى العالم.
اقرأ أيضاً: ما هو تشات جي بي تي (ChatGPT)؟ وهل سيزلزل عرش جوجل ويهدد وظائف البشر؟
وذكرت الشركة الناشئة، المملوكة بنسبة 49% لمايكروسوفت، في أواخر أغسطس/ آب الماضي، أنها تتوقع أن تصل إيراداتها إلى مليار دولار عام 2023، ويُعتقد أن حجم استثمار مايكروسوفت في الشركة يبلغ نحو 10 مليارات دولار.