ستقدم شركة جوجل نظاماً جديداً باسم "أسترا" (Astra) في وقت لاحق من هذا العام، وتعد بأنه سيكون أقوى نوع أطلقته من أنواع المساعدات التي تعمل بالذكاء الاصطناعي وأكثرها تطوراً على الإطلاق. يستطيع الجيل الحالي من مساعدات الذكاء الاصطناعي، مثل تشات جي بي تي (ChatGPT)، جمع المعلومات وتقديم الإجابات، لكنه يقف عند هذا الحد. غير أن جوجل قررت هذا العام أن تعيد بناء العلامة التجارية لمساعداتها الرقمية لتصبح "وكلاء برمجيين" أكثر تطوراً، وتقول الشركة إن الوكيل البرمجي يستطيع أن يفكر ويخطط، كما أنه يتمتع بمهارات تتعلق بالذاكرة، وهو قادر على اتخاذ خطوات متعددة من أجل تنفيذ المهام.
اقرأ أيضاً: كيف تمكن باحثون من استخدام تشات جي بي تي لشن الهجمات السيبرانية؟
وكيل برمجي بدلاً من المساعد الرقمي
سيتمكن الناس من استخدام أسترا من خلال هواتفهم الذكية، وربما أجهزة الكمبيوتر المكتبية، لكن الشركة تدرس خيارات أخرى أيضاً، مثل دمجه في نظارات ذكية أو غير ذلك من الأجهزة، كما قال نائب الرئيس لشؤون الأبحاث في جوجل ديب مايند (Google DeepMind)، أوريول فينيالس، في تصريح لمجلة إم آي تي تكنولوجي ريفيو. وفي اتصال هاتفي قبل مؤتمر آي أو (I/O) الذي نظمته جوجل، قال الرئيس التنفيذي للشركة، سوندار بيتشاي: "ما زلنا في المراحل المبكرة للغاية من تطوير الوكلاء البرمجيين الذين يعملون بالذكاء الاصطناعي".
وقال الرئيس التنفيذي والمؤسس المشارك في جوجل ديب مايند، ديميس هاسابيس: "لطالما أردنا بناء وكيل برمجي شامل بحيث يكون مفيداً في الحياة اليومية. لنتخيل وكلاء برمجيين قادرين على رؤية ما نفعله وسماعه، وفهم السياق الذي نحن فيه بصورة أفضل، والاستجابة بسرعة خلال المحادثات، ما يجعل وتيرة التفاعل وجودته يبدوان طبيعيين أكثر بكثير من ذي قبل". ويقول إن هذا ما ستكون عليه حال أسترا.
أسترا: وكيل برمجي قادر على رؤية ما نفعله وسماعه
أتى إعلان جوجل بعد يوم من الإعلان الذي أطلقته الشركة المنافسة لها، أوبن أيه آي (OpenAI)، حيث كشفت الستار عن مساعد الذكاء الاصطناعي المتطور الخاص بها، جي بي تي 4 أو (GPT-4o). يستطيع أسترا من جوجل ديب مايند أن يستجيب للمدخلات الصوتية ومدخلات الفيديو، على نحو مماثل لنظام جي بي تي 4 أو تقريباً (وإن كانت استجابته تتمتع بمستوى أقل من الإطراء).
في عرض تجريبي مخصص لوسائل الإعلام، وجه أحد المستخدمين كاميرا هاتف ذكي ونظارة ذكية إلى عدة أشياء وطلب من أسترا أن يشرح ماهيتها. وعندما وجه هذا الشخص الجهاز إلى خارج النافذة وسأل أسترا: "في أي حي تعتقد أنني موجود؟" تمكن نظام الذكاء الاصطناعي من التعرف على منطقة كينغز كروس في لندن، حيث يقع مقر جوجل ديب مايند. أيضاً، تمكن النظام من أن يقول إن نظارة المستخدم كانت على الطاولة، بما أنه سجل صورتها في وقت سابق من التفاعل.
ذكاء اصطناعي متعدد الوسائط
يبرز هذا العرض التجريبي رؤية جوجل ديب مايند للذكاء الاصطناعي المتعدد الوسائط (الذي يمكنه التعامل مع أنواع متعددة من المدخلات، مثل الصوت والفيديو والنصوص وغير ذلك)، ويعمل في الزمن الحقيقي، على حد تعبير فينيالس. ويقول: "نحن متحمسون للغاية إزاء مستقبل سنصبح فيه قريبين جداً من المستخدم، وقادرين على مساعدته في أي شيء يريده". عمدت جوجل مؤخراً إلى ترقية نموذج الذكاء الاصطناعي جيميناي (Gemini) حتى يصبح قادراً على معالجة كميات كبيرة من اليبانات، وهي ترقية تساعده على التعامل مع مستندات ومقاطع فيديو أكبر حجماً، وخوض محادثات أطول.
تخوض الشركات التكنولوجية منافسة محمومة لتحقيق الصدارة في مجال الذكاء الاصطناعي، ويمثل الوكلاء البرمجيون الذين يعملون بالذكاء الاصطناعي أحدث محاولة من الشركات التكنولوجية الكبيرة لاستعراض قدرتها على توسيع حدود التطوير. أيضاً، يتوافق الوكلاء البرمجيون مع توجهات الكثير من الشركات التكنولوجية، بما فيها أوبن أيه آي وجوجل ديب مايند، التي تسعى إلى بناء الذكاء الاصطناعي العام، وهو فكرة افتراضية إلى حد كبير لأنظمة الذكاء الاصطناعي الفائقة الذكاء.
يقول الأستاذ في جامعة واشنطن، شيراغ شاه، المختص بالبحث عبر الإنترنت: "في نهاية المطاف، سيصبح لديك وكيل برمجي يعرفك معرفة جيدة للغاية، ويستطيع تنفيذ الكثير من المهام نيابة عنك، ويستطيع أن يعمل عبر عدة مهام ومجالات مختلفة". لا تزال هذه الرؤية طموحة. لكن يجب أن ننظر إلى هذا الإعلان بوصفه محاولة من جوجل لمواكبة المنافسين. فمن خلال التعجيل بإطلاق هذه المنتجات، تستطيع جوجل جمع المزيد من البيانات من أكثر من مليار مستخدم حول كيفية استخدام نماذجها والميزات المفيدة والناجحة، كما يقول شاه.
اقرأ أيضاً: غروك 1.5 فيجن: إليك ما نعرفه عن نموذج الذكاء الاصطناعي المتعدد الوسائط
قدرات ذكاء اصطناعي تتجاوز الوكلاء البرمجيين
تكشف جوجل اليوم الستار عن الكثير من قدرات الذكاء الاصطناعي الجديدة التي تتجاوز الوكلاء البرمجيين. فسوف تعمّق دمج الذكاء الاصطناعي في محرك البحث الخاص بها عبر ميزة جديدة تسمى "تلميحات الذكاء الاصطناعي" (AI overviews)، حيث تجمع المعلومات من الإنترنت وتقدمها إلى المستخدم على شكل ملخصات قصيرة للإجابة عن عمليات البحث. ستكون هذه الميزة التي أطلقتها مؤخراً متاحة فقط في الولايات المتحدة مبدئياً، مع إتاحة الوصول إليها في المزيد من البلدان لاحقاً. ستساعد هذه الميزة على تسريع عملية البحث، وستتيح للمستخدمين إمكانية الحصول على إجابات أكثر تحديداً كلما كانت أسئلتهم أكثر تعقيداً ومتخصصة بدرجة أكبر، على حد تعبير الزميل الباحث المختص بالذكاء الاصطناعي والأخبار الرقمية في معهد رويترز للصحافة (Reuters Institute for Journalism)، فيليكس سيمون. ويقول: "أعتقد أن هذه المسألة لطالما كانت تمثل نقطة ضعف محرك البحث".
يمثل تحسين قدرات التخطيط ميزة من الميزات الجديدة الأخرى لمحرك البحث الذي يعتمد على الذكاء الاصطناعي من جوجل. فسوف يتمكن المستخدمون قريباً من أن يطلبوا من محرك البحث تقديم اقتراحات حول الطعام والسفر، على سبيل المثال، على غرار ما يُطلب من وكيل السفر من اقتراحات حول المطاعم والفنادق. سيصبح جيميناي قادراً على مساعدة المستخدمين على التخطيط لما يجب فعله أو شراؤه من أجل إعداد وصفات الطعام، كما سيتمكن المستخدمون من خوض محادثات مع نظام الذكاء الاصطناعي، وتوجيه مختلف أنواع الطلبات إليه، بدءاً من المهام الرتيبة نسبياً مثل تقديم نشرة أحوال الطقس، وصولاً إلى المهام المعقدة للغاية مثل مساعدتهم على الاستعداد لإجراء مقابلة عمل أو لإلقاء خطاب مهم. سيتمكن المستخدمون أيضاً من مقاطعة جيميناي في أثناء حديثه، وتوجيه الأسئلة إليه بهدف الاستيضاح، تماماً كما يحدث في أثناء المحادثات الحقيقية.
وفي خطوة أخرى تهدف إلى مجاراة الشركة المنافسة أوبن أيه آي، كشفت جوجل الستار أيضاً عن فيو (Veo)، وهو نظام ذكاء اصطناعي جديد لتوليد الفيديو. يستطيع فيو توليد مقاطع فيديو قصيرة، كما يسمح للمستخدمين بمزيد من السيطرة على الأساليب السينمائية من خلال فهم أوامر نصية على غرار "لقطات مُسَرّعة" أو "لقطات جوية للمشهد". تتمتع جوجل بميزة كبيرة فيما يتعلق بتدريب نماذج توليد الفيديو، لأنها تمتلك منصة يوتيوب. وقد أعلنت عن مشاريع مشتركة مع فنانين مثل دونالد غلوفر وويكليف جين، اللذين يستخدمان تكنولوجيتها في إنتاج أعمالهما.
في وقت سابق من هذه السنة، تلعثمت الرئيسة التنفيذية للتكنولوجيا في أوبن أيه آي، ميرا موراتي، عندما سئلت إن كان نموذج الشركة قد دُرِّب باستخدام بيانات من يوتيوب. كما أن كبير مدراء الأبحاث في جوجل ديب مايند، دوغلاس إيك، كان غامضاً في إجابته عن سؤال إم آي تي تكنولوجي ريفيو حول البيانات المستخدمة في تدريب فيو، لكنه قال إنه "من الممكن أن البيانات المستخدمة في تدريبه تتضمن شيئاً من محتوى يوتيوب انسجاماً مع اتفاقياتنا مع صانعي المحتوى على يوتيوب".
اقرأ أيضاً: كيف تحصل شركات الذكاء الاصطناعي التوليدي على بياناتك؟ وكيف تحميها؟
تقدم جوجل نظام الذكاء الاصطناعي التوليدي الخاص بها بوصفه أداة تتيح للفنانين إنتاج أعمالهم، غير أن هذه الأدوات تحصل على الأرجح على قدرتها على الإنتاج بالاعتماد على المواد التي أنتجها الفنانون من قبل، كما يقول شاه. تعرضت شركات الذكاء الاصطناعي مثل جوجل وأوبن أيه آي إلى عدد كبير من الدعاوى القضائية التي رفعها كتّاب وفنانون يزعمون أن هذه الشركات استغلت ملكياتهم الفكرية دون الحصول على موافقتهم أو تقديم أي تعويضات لهم. يقول شاه: "تمثل هذه الأنظمة بالنسبة إلى الفنانين سلاحاً ذا حدين".