هل يكون مشروع جوجل الجديد أسترا التطبيق القاتل في مجال الذكاء الاصطناعي التوليدي؟

7 دقيقة
هل يكون مشروع جوجل الجديد أسترا التطبيق القاتل الذي طال انتظاره في مجال الذكاء الاصطناعي التوليدي؟

أعلنت جوجل ديب مايند عن مجموعة كبيرة ومثيرة للإعجاب من المنتجات والنماذج الأولية الجديدة، التي قد تعيدها إلى صدارة السباق نحو نقل الذكاء الاصطناعي التوليدي إلى نطاق الأسواق الكبيرة.

من أهم هذه المنتجات جيميناي 2.0 (Gemini 2.0) وهو أحدث إصدار من مجموعة النماذج اللغوية الكبيرة المتعددة الوسائط من جوجل ديب مايند، التي جرت إعادة تصميمها حالياً بحيث تمتلك القدرة على التحكم في المنظومات الوكيلة- وإصدار جديد من مشروع أسترا (Project Astra)، وهو التطبيق الشامل التجريبي الذي ألمحت إليه جوجل في مؤتمر "آي أو" (I/O) الذي نظمته في مايو/أيار.

 وقد تسنت الفرصة لإم آي تي تكنولوجي ريفيو لتجربة أسترا في عرض توضيحي مباشر خلف الأبواب المغلقة منذ فترة وجيزة.

كانت تجربة مذهلة، لكنّ ثمة فرقاً كبيراً بين العرض الترويجي المعد بعناية، والعرض التوضيحي المباشر.

يعتمد أسترا على إطار منظومة وكيلة مدمج يخص نموذج جيميناي 2.0 للإجابة عن الأسئلة وتنفيذ المهام عبر النصوص والكلام والصور والفيديو، واستدعاء تطبيقات حالية من جوجل مثل سيرتش (Search) ومابس (Maps) ولينز (Lens) عند الحاجة.

تقول مديرة المنتجات في أسترا، بيبو شو: "يدمج هذا النظام بعضاً من أقوى أنظمة استرجاع المعلومات في عصرنا هذا". 

اقرأ أيضاً: لماذا ما يزال حل مشكلة هلوسة الذكاء الاصطناعي صعباً حتى مع آخر تحديثات تشات جي بي تي وجيميناي؟

منتجات جديدة تستند إلى المنظومات الوكيلة

إضافة إلى جيميناي 2.0 وأسترا، طرحت الشركة مارينر (Mariner)، وهي منظومة وكيلة جديدة مبنية على أساس جيميناي، وتستطيع تصفح الويب نيابة عنك، وجولز (Jules)، وهو مساعد برمجة جديد يعتمد على جيميناي، وجيميناي فور غيمز (Gemini for Games)، وهو مساعد تجريبي يمكنك أن تدردش معه وتوجه إليه الأسئلة في أثناء ممارستك لألعاب الفيديو.

 ويجب ألا ننسى أن جوجل ديب مايند أعلنت أيضاً مؤخراً عن فيو (Veo)، وهو نموذج جديد لتوليد الفيديو، وإيماجن 3 (Imagen 3)، وهو إصدار جديد من نموذجها لتوليد الصور، وويلو (Willow)، وهو نوع جديد من الرقائق المخصصة للحوسبة الكمومية.

 إنه عدد كبير من المنتجات. في هذه الأثناء، كان الرئيس التنفيذي للشركة، ديميس هاسابيس، في زيارة إلى السويد مؤخراً كي يتلقى جائزة نوبل.

 تزعم جوجل ديب مايند أن جيميناي 2.0 أسرع بمرتين من الإصدار السابق، جيميناي 1.5، وأنه يتفوق عليه في عدد من المقاييس المعيارية، بما في ذلك "قياس الفهم الشامل الاحترافي المتعدد المهام للغة (MMLU-Pro)"، وهو مجموعة كبيرة من الأسئلة المتعددة الخيارات المصممة لاختبار قدرات النماذج اللغوية الكبيرة في مجموعة من المواضيع، بدءاً بالرياضيات والفيزياء وصولاً إلى الصحة وعلم النفس والفلسفة.

لكن الفوارق بين النماذج الأحدث مثل جيميناي 2.0 والنماذج من مختبرات منافسة، مثل أوبن أيه آي وأنثروبيك (Anthropic)، أصبحت الآن صغيرة.

حالياً، لم تعد التطورات التي تشهدها النماذج اللغوية الكبيرة تتعلق بقدراتها بقدر ما أصبحت تتعلق بما يمكنك أن تفعله من خلالها.

وهنا يأتي دور المنظومات الوكيلة.

اقرأ أيضاً: ما هو وكيل الذكاء الاصطناعي؟ وكيف يساعدك في حياتك اليومية؟

تجربة عملية لمشروع أسترا

مؤخراً، جرى اصطحابي عبر باب لا يحمل أي علامة مميزة في أحد الطوابق العلوية لمبنى في مقاطعة كينغز كروس في لندن، حيث دخلت غرفة تسودها أجواء توحي بقوة بوجود مشاريع سرية.

كانت كلمة "ASTRA" مكتوبة بأحرف عملاقة على أحد الجدران.

كان كلب شو، تشارلي، الذي يعد تميمة الحظ السعيد للمشروع بحكم الواقع، يتجول بين المكاتب حيث كان الباحثون والمهندسون مشغولين ببناء منتج تراهن جوجل بمستقبلها عليه.

يقول القائد المشارك لفريق أسترا، غريغ واين: "إذا أردت طرح المشروع على والدتي، فسوف أقول لها إننا نبني نظام ذكاء اصطناعي مزوداً بأعين وآذان وصوت.

يستطيع هذا النظام أن يرافقك أينما تكونين، ويستطيع أن يساعدك في أي شيء تفعلينه.

لم نصل إلى هذه المرحلة بعد، لكن هذه رؤيتنا للمشروع تقريباً".

المصطلح الرسمي للنظام الذي يعمل واين وشو وزملاؤهما على بنائه هو "المساعد الشامل" (universal assistant).

وما زالوا يحاولون معرفة ما يعنيه هذا المصطلح بالضبط.

كانت هناك مجموعتان من الديكورات المسرحية في أحد طرفي غرفة أسترا، يستخدمهما الفريق للعروض التوضيحية، وتمثل هاتان المجموعتان طاولة كبيرة للمشروبات ونموذجاً مصغراً لمعرض فني.

أخذتني شو إلى طاولة المشروبات أولاً.

قال القائد المشارك الآخر، برافين سرينيفاسان: "منذ فترة طويلة، استأجرنا خبيراً في المشروبات وطلبنا منه أن يعلمنا كيفية إعداد المشروبات.

سجلنا تلك المحادثات، واستخدمناها في تدريب نموذجنا الأولي".

فتحت شو كتاب طبخ بحثاً عن وصفة لكاري الدجاج، ووجهت هاتفها إليها، واستدعت أسترا.

وفجأة، قال صوت أنثوي: "ني هاو، يا بيبو!" (ني هاو: تحية باللغة الصينية)

فسألت شو هاتفها قائلة: "ياللعجب!

لماذا تتحدثين إلي بالصينية؟

هلا تحدثت إلي بالإنجليزية من فضلك؟"

رد الصوت: "أعتذر يا بيبو. فقد كنت أتبع تعليمات سابقة بالتحدث باللغة الصينية.

أما الآن، فسأتحدث بالإنجليزية كما طلبت".

قالت لي شو إن أسترا يتذكر المحادثات السابقة.

كما يحتفظ في ذاكرته بآخر 10 دقائق من مقطع الفيديو.

(يتضمن العرض الترويجي الذي نشرته جوجل في مايو/أيار لحظة مثيرة للإعجاب، وذلك عندما يخبر أسترا المشرفة التي تقدم العرض بالمكان الذي تركت فيه نظارتها، حيث لاحظ وجودها على المكتب قبل بضع ثوانٍ. لكنني لم أر شيئاً مماثلاً خلال العرض التوضيحي المباشر).

لنعد إلى كتاب الطبخ.

حركت شو كاميرا هاتفها فوق الصفحة عدة ثوانٍ، وطلبت من أسترا أن يقرأ الوصفة ويخبرها بالتوابل الموجودة فيها.

ردّ أسترا قائلاً: "أتذكّر أن الوصفة تذكر ملعقة صغيرة من حبوب الفلفل الأسود، وملعقة صغيرة من مسحوق الفلفل الحار، وعوداً من القرفة". 

وقالت شو: "أعتقد أنك نسيت بعض التوابل الأخرى.

ألقِ نظرة أخرى".

"أنت محقة، أعتذر منك. أرى أيضاً أن المكونات تتضمن الكركم المطحون وأوراق الكاري".

عندما يرى المرء كيفية عمل هذه التكنولوجيا، سيدرك أمرين على الفور.

الأمر الأول أنها ترتكب الكثير من الأخطاء، وتحتاج إلى التصحيح على الدوام. أما الأمر الثاني فهو أنه يمكن تصحيح هذه الأخطاء من خلال عدة كلمات منطوقة وحسب.

يكفي ببساطة أن تقاطع الصوت المتكلم، وتكرر تعليماتك، وتمضي قدماً.

يبدو الأمر أشبه بتدريب طفل منه بجلسة عمل عصيبة مع برنامج مليء بالأخطاء والمشاكل.

بعد ذلك، وجهت شو هاتفها إلى صف من زجاجات المشروبات، وطلبت من أسترا أن يختار المشروب الأنسب لتناوله مع وصفة كاري الدجاج.

اختار أسترا أحد هذه المشروبات وشرح سبب اختياره هذا.

بعد ذلك، سألته شو عن سعر الزجاجة. وقال أسترا إنه يحتاج إلى استخدام تطبيق البحث سيرتش للبحث عن الأسعار عبر الإنترنت. وبعد عدة ثوانٍ، عاد أسترا بالإجابة.

 انتقلنا بعد ذلك إلى المعرض الفني، وعرضت شو على أسترا عدداً من الشاشات التي تعرض لوحات فنية شهيرة، مثل الموناليزا، ولوحة الصرخة للرسام مونك، ولوحة للرسام فيرمير، ولوحة للرسام سيورات، والعديد من اللوحات الأخرى.

قال الصوت: "ني هاو، يا بيبو!"

وقالت شو: "أنت تتحدثين إلي بالصينية ثانية.

جربي أن تتحدثي إلي بالإنجليزية من فضلك".

رد أسترا: "المعذرة، يبدو أنني أسأت الفهم. أجل، سأرد عليك بالإنجليزية". (أعلم أن هذا مستحيل، لكنني أكاد أقسم إنني سمعت ضحكة خافتة متهكمة).

حان دوري بعد ذلك. وأعطتني شو هاتفها.

حاولت أن أخدع أسترا وأدفعه إلى ارتكاب خطأ ما، لكنني لم أتمكن من ذلك. فقد سألته عن اسم المعرض الفني الشهير الذي نقف فيه الآن، لكنه رفض أن يخاطر بتخمين خاطئ.

وبعد ذلك، سألته عن السبب الذي دفعه إلى وصف هذه الرسومات بأنها نسخ غير أصلية، فأخذ يعتذر عن خطئه (أسترا يعتذر كثيراً).

اضطررت إلى مقاطعته: "كلا، أنت محقة، إنها ليست غلطة.

أنت محقة في وصفك للوحات على الشاشات بأنها لوحات مزيفة".

لم أستطع أن أمنع نفسي من الشعور بالسوء بعض الشيء:

فقد أربكت تطبيقاً لا يهدف وجوده سوى إلى إرضائنا.

عندما يبلي أسترا حسناً، يكون رائعاً. وتبدو تجربة خوض محادثة مع هاتفك حول أي شيء توجهه إليه جديدة وسلسة.

في إحاطة إعلامية مؤخراً، شاركت جوجل ديب مايند مقطع فيديو يوضح استخدامات أخرى: مثل قراءة رسالة إلكترونية على شاشة الهاتف للعثور على رمز لفتح أحد الأبواب (وتذكير المستخدم بهذا الرمز لاحقاً)، وتوجيه الهاتف إلى حافلة تسير في الشارع وسؤاله عن وجهتها، وتوجيه الأسئلة إلى الهاتف حول الأعمال الفنية الموجودة في الأماكن العامة في أثناء المرور قربها.

قد يكون أسترا التطبيق القاتل في مجال الذكاء الاصطناعي التوليدي.

ولكن لا يزال الطريق طويلاً قبل أن يتمكن معظم الناس من الحصول على مثل هذه التكنولوجيا.

لم تذكر الشركة تاريخ إطلاق هذا التطبيق. أيضاً، شاركت جوجل ديب مايند مقاطع فيديو لأسترا وهو يعمل على نظارات ذكية، لكن هذه التكنولوجيا تقع في أسفل قائمة التطبيقات التي تهم الشركة.

اقرأ أيضاً: أسترا: مساعد ذكي من جوجل يساعد على كتابة البرمجيات

تركيبة منوعة

في الوقت الحالي، يراقب الباحثون خارج جوجل ديب مايند التقدم الذي تحرزه الشركة في هذا التطبيق من كثب.

تقول الباحثة التي تعمل على النماذج اللغوية الكبيرة في جامعة كوين ماري في لندن ومعهد آلان تورينغ، ماريا لياكاتا: "إن الأسلوب المُتبع في الجمع بين هذه الأنظمة المختلفة رائع.

فمن الصعب تصميم نظام منطقي قائم على التفاهم باستخدام اللغة فقط، لكن في هذا النظام، يجب استخدام الصور وغيرها أيضاً. لا يمكن أن نستخف بهذا الإنجاز".

كما نال أسترا إعجاب لياكاتا أيضاً بفضل قدرته على تذكر الأشياء التي رآها أو سمعها.

تعمل لياكاتا على ما تسميه "السياق البعيد المدى" (long-range context)، حيث تعمل على إكساب النماذج القدرة على تتبع المعلومات التي صادفتها سابقاً.

تقول لياكاتا: "هذا أمر مشوق. حتى إن تحقيقه باستخدام وسيط واحد أمر مشوق".

لكنها تعترف أن نسبة كبيرة من تقييماتها لا تعدو أنها تخمينات.

وتقول: "إن التفكير المنطقي المتعدد الوسائط من أحدث التقنيات. لكن من الصعب جداً تحديد المرحلة التي وصلت إليها بالضبط، لأن الباحثين لم يفصحوا عن الكثير من المعلومات حول ماهية التكنولوجيا نفسها".

 بالنسبة إلى الباحث الذي يعمل على النماذج المتعددة الوسائط والمنظومات الوكيلة المتعددة الوسائط في معهد آلين للذكاء الاصطناعي (Allen Institute for AI)، بوديساتوا ماجومدر، فإن هذه المسألة تشكل مصدر قلق رئيسياً.

ويقول: "ليس لدينا أي فكرة عن الطريقة التي اتبعتها جوجل لتحقيق هذا الأمر".

ويشير إلى أنه لو كانت جوجل أكثر انفتاحاً بقليل حول المشاريع التي تعمل عليها، فقد يكون هذا عاملاً مساعداً للمستهلكين على فهم حدود قدرات هذه التكنولوجيا التي قد تصبح بين أيديهم عما قريب.

ويقول: "إنهم في حاجة إلى فهم كيفية عمل هذه الأنظمة. من الأفضل أن يكون المستخدم قادراً على معرفة المعلومات التي اكتسبها النظام حولك، من أجل تصحيح الأخطاء، أو حذف المعلومات التي تريد أن تحتفظ بخصوصيتها".

 تشعر لياكاتا أيضاً بالقلق بشأن العواقب المترتبة على الخصوصية، وتشير إلى أنه من الممكن أن يتعرض الناس للمراقبة دون موافقتهم.

وتقول: "أعتقد أن ثمة أشياء تثير حماستي وأشياء أخرى تثير قلقي. ثمة ما يثير الريبة عندما يتحول هاتفك إلى ما يشبه العينين بالنسبة لك، إنه أمر يثير الإزعاج. إن أثر هذه المنتجات على المجتمع سيكون كبيراً جداً، إلى درجة تفرض علينا أن نأخذه على محمل الجد. لكن هذا التوجه أصبح بمثابة سباق بين الشركات. وهذا أمر يثير المشاكل، خصوصاً في ظل انعدام أي توافق حول كيفية تقييم هذه التكنولوجيا".

 تقول جوجل ديب مايند إنها تدرس مسائل الخصوصية والأمان والسلامة في منتجاتها الجديدة جميعاً بدرجة عالية من التأني والحرص.

وستلجأ إلى فرق من المستخدمين الموثوقين لاختبار تكنولوجياتها عدة أشهر قبل طرحها للعامة.

اقرأ أيضاً: كيف تستخدم سورا: أداة توليد الفيديو الجديدة من أوبن أيه آي؟

تقول مديرة التطوير والابتكار المسؤول في جوجل ديب مايند، داون بلوكسويتش: "من الواضح أننا يجب أن نفكر فيما يحدث عندما تسوء الأمور. ثمة إمكانات هائلة. والمكاسب على صعيد الإنتاجية هائلة. لكن الأمر محفوف بالمخاطر أيضاً".

لا يستطيع أي فريق من مختصي الاختبارات أن يتنبأ بالطرق جميعها التي يستخدم بها الناس التكنولوجيا الجديدة أو يسيئون استخدامها.

إذاً، ما هي الخطة لمواجهة المشاكل التي لا مفر منها؟

يجب على الشركات أن تصمم المنتجات التي يمكن سحبها من الفضاء الإلكتروني أو إيقاف تشغيلها، تحسباً لوقوع أي مشكلة، تقول بلوكسويتش: "إذا احتجنا إلى تطبيق تغييرات سريعة أو سحب منتج ما، فسوف يكون بوسعنا فعل هذا".

المحتوى محمي