منذ فترة وجيزة، أعلنت شركتا جوجل وأوبن أيه آي (OpenAI) عن بناء مساعدات رقمية فائقة القدرات وتعمل بالذكاء الاصطناعي، وهي أدوات قادرة على أن تخوض حوارات مع المستخدم في الزمن الحقيقي، وتتابع الحوار عند مقاطعتها، وتحلل البيئة المحيطة بك عبر الفيديو، وتترجم الحوارات بصورة فورية.
كانت أوبن أيه آي السباقة في إعلانها؛ حيث أطلقت نموذجها الرائد الجديد الذي يحمل اسم "جي بي تي 4 أو" (GPT-4o). وقد ظهر النموذج في العرض التجريبي المباشر وهو يقرأ قصص ما قبل النوم ويساعد على حل المسائل الرياضية، مستخدماً في ذلك كله صوتاً يبدو مخيفاً وشبيهاً بصوت صديقة الشخصية التي أداها الممثل خواكين فينيكس –وهي نظام ذكاء اصطناعي- في فيلم "هي" (Her)؛ وهي صفة لفتت انتباه الرئيس التنفيذي سام ألتمان.
وبعد ذلك بيوم واحد، أعلنت جوجل عن أدواتها الجديدة التي تتضمن مساعداً رقمياً يعمل بالحوار ويحمل اسم "جيميناي لايف" (Gemini Live)، وهو قادر على تنفيذ المهام نفسها تقريباً. كما أعلنت أنها تعمل على بناء وكيل رقمي يعمل بالذكاء الاصطناعي "لفعل كل شيء" تقريباً، وهو حالياً قيد التطوير، غير أن الشركة لن تصدره حتى وقت لاحق من هذا العام. قريباً، سيصبح بوسعك أن تكتشف بنفسك إن كان بإمكانك الاعتماد على هذه الأدوات في حياتك اليومية بالقدر الذي يأمله مصمموها، أو إن كانت أشبه بإحدى حيل الخيال العلمي الهزيلة التي ستفقد سحرها في نهاية المطاف. وإليك فيما يلي ما يجب أن تعرفه حول كيفية الوصول إلى هذه الأدوات الجديدة، واستخداماتها الممكنة، وتكاليف استخدامها.
اقرأ أيضاً: ما الفرق بين تشات جي بي تي وجيميناي من حيث القدرات؟
جي بي تي 4 أو من أوبن أيه آي
قدرات النموذج: يستطيع النموذج أن يتحدث معك في الزمن الحقيقي، ويبلغ تأخير الاستجابة 320 ميلي ثانية تقريباً، وهو تأخير يجعله مكافئاً للحوار البشري الطبيعي كما تقول الشركة. يمكنك أن تطلب من النموذج أن يترجم لك أي شيء توجه كاميرا الهاتف الذكي إليه، ويستطيع تقديم المساعدة في مهام مثل البرمجة أو ترجمة النصوص. كما يستطيع أيضاً تلخيص المعلومات، وتوليد الصور، وخطوط الكتابة، والرسوم التمثيلية الثلاثية الأبعاد.
كيفية الوصول: تقول أوبن أيه آي إنها ستبدأ نشر ميزات النموذج جي بي تي 4 أو المتعلقة بالنصوص والرؤية على واجهة الويب وتطبيق جي بي تي (GPT)، غير أنها لم تحدد موعداً لذلك. وتقول الشركة إنها ستضيف الوظائف الصوتية في الأسابيع المقبلة، على الرغم من أنها لم تحدد موعداً لذلك أيضاً. يستطيع المطورون الوصول إلى ميزات النصوص والرؤية حالياً عبر واجهة برمجة التطبيقات؛ لكن الشركة ستتيح الوضع الصوتي في البداية أمام "مجموعة صغيرة" من المطورين فقط.
التكلفة: سيكون استخدام جي بي تي 4 أو مجانياً؛ لكن أوبن أيه آي ستفرض قيوداً على حدود استخدام النموذج قبل أن يحتاج المستخدم إلى الترقية في إطار خطة اشتراك مدفوعة. ستتيح أوبن أيه آي للمشتركين في خطط الاشتراك المدفوعة لديها؛ التي تبدأ رسومها بقيمة 20 دولاراً في الشهر، إمكانية استخدام نسخة من جي بي تي 4 أو بقدرات تفوق قدرات النسخة المجانية منه بـ 5 أضعاف.
جيميناي لايف من جوجل
ما هو جيميناي لايف؟
يمثل جيميناي لايف منتج جوجل الأقرب إلى جي بي تي 4 أو، وهو نسخة من نموذج الذكاء الاصطناعي الخاص بالشركة مع ميزة الحوار في الزمن الحقيقي. تقول جوجل إنه سيصبح من الممكن أيضاً استخدام الأداة للتواصل عبر الفيديو المباشر "في وقت لاحق من هذا العام". وتعد الشركة بأنه سيكون مساعداً مفيداً يعتمد على الحوار لتنفيذ مهام مثل المساعدة على الاستعداد لإجراء مقابلات العمل أو التدرب على إلقاء خطاب.
كيفية الوصول: من المنتظر إطلاق جيميناي لايف "خلال الأشهر المقبلة" في إطار خطة الاشتراك المدفوعة في خدمة جوجل للذكاء الاصطناعي، جيميناي أدفانسد (Gemini Advanced).
التكلفة: تتضمن خطة الاشتراك بخدمة جيميناي أدفانسد فترة تجريبية مجانية مدتها شهران، وتكلف بعد ذلك 20 دولاراً شهرياً.
لكن ما هو مشروع أسترا؟
تسعى جوجل من خلال مشروع أسترا (Project Astra) إلى بناء وكيل رقمي شامل يعمل بالذكاء الاصطناعي، وقد قدمت عرضاً تجريبياً له في مؤتمر آي أو (I/O) الذي نظمته جوجل؛ غير أنها لن تطلقه حتى وقت لاحق من هذا العام. وسيتمكن الناس من استخدام أسترا عبر هواتفهم الذكية، وربما أجهزة الكمبيوتر المكتبية؛ لكن الشركة تدرس خيارات أخرى أيضاً؛ مثل دمجه في نظارات ذكية أو أجهزة أخرى، كما قال نائب الرئيس للأبحاث في جوجل ديب مايند (Google DeepMind)، أوريول فينيالس، في تصريح لمجلة إم آي تي تكنولوجي ريفيو.
اقرأ أيضاً: أسترا: مساعد ذكي من جوجل يساعد على كتابة البرمجيات
أيهما أفضل؟
من الصعب تحديد النموذج الأفضل دون الحصول على النسخة الكاملة من كلا النموذجين بأنفسنا. فقد عرضت جوجل مشروع أسترا عبر مقطع فيديو أنيق، على حين فضلت أوبن أيه آي إطلاق جي بي تي 4 أو أول مرة عبر عرض تجريبي مباشر يبدو أكثر واقعية، لكن من المرجح أن المكلفين بتصميم كلا العرضين طلبوا من النموذجين تنفيذ مهام سبق لهم أن جربوها. أما الاختبار الحقيقي فسوف يبدأ عند إطلاق النموذجين أول مرة ليصبحا متاحَين أمام الملايين من المستخدمين ذوي المتطلبات الفريدة والمتنوعة.
وبصرف النظر عما سبق، فإن المقارنة بين محتوى مقاطع الفيديو التي نشرتها أوبن أيه آي ومحتوى تلك التي نشرتها جوجل تظهر أن الأداتين الرئيسيتين تبدوان متشابهتين للغاية، على الأقل من حيث سهولة الاستخدام. عموماً، يبدو جي بي تي 4 أو أفضل بقليل من حيث الصوت، حيث يتميز بأصوات واقعية، وحوار سلس، بل إنه قادر حتى على الغناء، على حين يبدو مشروع أسترا أكثر تطوراً من حيث الإمكانات المرئية؛ مثل القدرة على "تذكّر" المكان الذي نسيت فيه نظاراتك. قد يعني قرار أوبن أيه آي بإطلاق الميزات الجديدة بسرعة أكبر أن منتجها سيُستخدم في بادئ الأمر أكثر من منتج جوجل، الذي لن يكون متاحاً حتى وقت لاحق من هذا العام. وما زال الوقت مبكراً على تحديد النموذج الذي "يهلوس" بالمعلومات المزيفة بنسبة أقل من الآخر، أو يقدم إجابات أكثر فائدة.
هل هذا النظامان آمنان؟
تقول كلتا الشركتين، أوبن أيه آي وجوجل، إن نماذجهما خضعت لاختبارات وافية؛ حيث تقول أوبن أيه آي إن جي بي تي 4 أو خضع لتقييم أكثر من 70 خبيراً في مجالات مثل المعلومات المزيفة وعلم النفس الاجتماعي، كما قالت جوجل إن جيميناي "خضع إلى أكثر عمليات تقييم السلامة شمولية بين نماذج الذكاء الاصطناعي في جوجل كلها حتى الآن؛ بما فيها تقييمات تخص التحيز والإساءة".
اقرأ أيضاً: أوبن إيه آي تطوّر أدوات تكشف الصور والأصوات المولَّدة عبر الذكاء الاصطناعي
لكن الشركتين تسعيان إلى بناء مستقبل تتولى فيه نماذج الذكاء الاصطناعي مهام البحث والتدقيق وتقييم معلومات العالم نيابة عنا، حتى تقدم إجابات موجزة عن أسئلتنا. وكما في حالة بوتات الدردشة الأقل تعقيداً وقدرة من هذه النماذج؛ يجب ألا نثق بما تخبرنا به. شاركت ميليسا هيكيلا في التغطية.