عندما صدر تشات جي بي تي (ChatGPT) للمرة الأولى، كان الجميع في مجال الذكاء الاصطناعي يتحدثون عن هذا الجيل الجديد من المساعدات البرمجية التي تعمل بالذكاء الاصطناعي. لكن الحماس انتقل إلى هدفٍ جديدٍ على مدار السنة الماضية: الوكلاء البرمجيون الذين يعملون بالذكاء الاصطناعي، وسنشير إليها باسم "وكلاء الذكاء الاصطناعي" فيما تبقى من المقال.
ظهر الوكلاء بصورة بارزة في مؤتمر آي أو (I/O) السنوي الذي نظّمته شركة جوجل في مايو/أيار، حيث كشفت الشركة الستار عن وكيلها الجديد للذكاء الاصطناعي الذي يحمل اسم "أسترا" (Astra)، والذي يُتيح للمستخدمين التفاعل معه عبر الصوت والفيديو. كما أطلقت أوبن أيه آي (OpenAI) على نموذجها الجديد جي بي تي 4 أو (GPT -4o) تسمية "وكيل الذكاء الاصطناعي" أيضاً.
وعلى الرغم من وجود شيء من الضجيج الإعلامي دون شك، فإن الموضوع أكبر من ذلك. فالشركات التكنولوجية تنفق مبالغ ضخمة على بناء وكلاء الذكاء الاصطناعي، ومن الممكن أن تؤدي جهودها البحثية إلى إطلاق أنظمة الذكاء الاصطناعي المفيدة من النوع الذي كنا نحلم به منذ عقود من الزمن. ويقول الكثير من الخبراء، بمن فيهم سام ألتمان، إن هذه الأنظمة تمثّل المرحلة المفصلية المقبلة.
لكن ما هي فعلياً؟ وكيف يمكن أن نستخدمها؟
ما هو وكيل الذكاء الاصطناعي؟
ما زلنا في المراحل المبكرة من الأبحاث المتعلقة بوكلاء الذكاء الاصطناعي، ولم يتوصل هذا الحقل إلى وضع تعريف محدد لهذه المنظومات. يمكن تعريفها ببساطة على أنها نماذج أو خوارزميات ذكاء اصطناعي بتصميم قادرة على اتخاذ القرارات بصورة مستقلة في عالم ديناميكي دائم التطور، كما يقول أحد كبار علماء الأبحاث في شركة إنفيديا (Nvidia)، جيم فان، الذي يقود مبادرة وكلاء الذكاء الاصطناعي في الشركة.
اقرأ أيضاً: نظام ذكاء اصطناعي يشغل منصب الرئيس التنفيذي: هل نراه قريباً في إنفيديا؟
تتلخص الرؤية الأشمل لوكيل الذكاء الاصطناعي بأنه نظام يستطيع تنفيذ مجموعة واسعة من المهام، على غرار المساعد البشري. ففي المستقبل، يمكن أن يساعدك على حجز مكان تمضي فيه عطلتك، غير أنه سيتذكر أيضاً أنك تفضّل الفنادق الفخمة، ولهذا سيقترح عليك فقط الفنادق المصنّفة على أنها 4 نجوم على الأقل، ثم سيحجز لك في الفندق الذي ستختاره من بين مجموعة الخيارات التي يقترحها عليك. بعد ذلك، سيقترح عليك رحلات الطيران الأكثر توافقاً مع جدول مواعيدك، ويخطط لمسار رحلتك بناءً على تفضيلاتك. ويمكنه إعداد قائمة بالأشياء التي يجب توضيبها بناءً على تلك الخطة وتوقعات الطقس. بل يمكنه حتى أن يرسل مخطط الرحلة إلى أي من الأصدقاء الذين يعرف أنهم يعيشون في المنطقة التي ستذهب إليها، ويدعوهم إلى الانضمام إليك. وفي مكان العمل، يمكنه أن يحلل قائمة مهامك وينفذ بعضاً منها، مثل إرسال الدعوات التي يتضمنها جدول مواعيدك، والمذكرات، والرسائل الإلكترونية.
تتمثل إحدى الرؤى لوكلاء الذكاء الاصطناعي في أنها متعددة الوسائط، أي أنها قادرة على معالجة اللغة والصوت والفيديو. ففي العرض التجريبي الذي قدّمته جوجل لإظهار قدرات أسترا، على سبيل المثال، يمكن لمستخدمي أسترا توجيه كاميرات هواتفهم الذكية نحو أشياء معينة، ويسألون وكيل الذكاء الاصطناعي عنها. يمكن للوكيل أن يستجيب للمدخلات التي تتنوع بين النصوص والصوت ومقاطع الفيديو.
يقول مدير مركز الذكاء الاصطناعي في كلية لندن الجامعية، ديفيد باربر، إن بإمكان هؤلاء الوكلاء أيضاً أن يجعلوا العمليات الخاصة بالشركات والمؤسسات العامة أكثر سلاسة. على سبيل المثال، قد يتمكن وكيل الذكاء الاصطناعي من تولي مهام بوت مخصص لخدمة العملاء ويتمتّع بقدرات أكثر تعقيداً. يستطيع الجيل الحالي من المساعدات التي تعتمد على النماذج اللغوية توليد النصوص بناءً على حساب الكلمة التالية التي يُرجّح ورودها في الجملة فقط. لكن وكيل الذكاء الاصطناعي سيتمتّع بالقدرة على التصرف بصورة مستقلة بناءً على الأوامر الموجّهة إليه باللغة الطبيعية، ومعالجة مهام خدمة العملاء دون إشراف. على سبيل المثال، سيتمكن الوكيل من تحليل رسائل العملاء الإلكترونية المتعلقة بالشكاوى، ثم معرفة أنه يجب أن يتحقق من الرقم المرجعي للعميل، والولوج إلى قواعد بيانات، مثل قاعدة بيانات إدارة علاقات العملاء وأنظمة التوصيل، للتحقق من صحة الشكوى، ومعالجتها وفقاً لسياسات الشركة، على حد قول باربر.
ما هي فئات الوكلاء البرمجيين؟
عموماً، ثمة فئتان متمايزتان من الوكلاء: الوكلاء البرمجيون والوكلاء المتجسدون، كما يقول فان.
يعمل الوكلاء البرمجيون على أجهزة الكمبيوتر أو الهواتف الخلوية، ويستخدمون التطبيقات، تماماً على غرار مثال وكيل السفر الذي ذكرناه آنفاً. ويقول: "هؤلاء الوكلاء مفيدون للغاية في العمل المكتبي أو إرسال الرسائل الإلكترونية أو الاستمرار في تنفيذ هذه الأحداث بصورة متواصلة".
أمّا الوكلاء المتجسدون فهم يعملون ضمن عالم ثلاثي الأبعاد، مثل ألعاب الفيديو أو ضمن روبوت. ويمكن لهذا النوع من الوكلاء المتجسدين أن يجعل ألعاب الفيديو أكثر جاذبية، حيث يمكن للأشخاص اللعب بشخصيات غير قابلة للعب، وهي شخصيات يتحكم فيها الذكاء الاصطناعي. يمكن لهذه الأنواع من الوكلاء أن تساعد أيضاً على بناء روبوتات أكثر فائدة، يمكنها مساعدتنا في المهام اليومية المنزلية، مثل طي الغسيل وطبخ الطعام.
كان فان عضواً في فريق بنى نظام ذكاء اصطناعي متجسداً يحمل اسم "ماين دوجو" (MineDojo) ضمن اللعبة الحاسوبية الشهيرة ماينكرافت (Minecraft). تمكن وكيل الذكاء الاصطناعي الذي بناه فان، بالاعتماد على مجموعة ضخمة من البيانات التي جُمِعت من الإنترنت، من تعلم مهارات ومهام جديدة أتاحت له إمكانية استكشاف العالم الافتراضي الثلاثي الأبعاد بحرية، وإنجاز مهام معقدة مثل تطويق حيوانات اللاما بالسياجات، أو غَرف الحمم باستخدام الدلو. تُعدّ ألعاب الفيديو وسيلة جيدة لتمثيل العالم الحقيقي، حيث تتطلب من الوكلاء فهم الفيزياء والتفكير المنطقي والمنطق العام.
ففي ورقة بحثية جديدة لم تخضع بعد لمراجعة الأقران، يقول باحثون من جامعة برينستون إن وكلاء الذكاء الاصطناعي يميلون عادة إلى أن يحملوا 3 خصائص مختلفة. فأنظمة الذكاء الاصطناعي تُعدّ "وكيلة" إذا كانت قادرة على السعي نحو تحقيق أهداف صعبة دون توجيه في بيئات معقدة. كما أنها مؤهلة لحمل هذه الصفة أيضاً إذا كان من الممكن توجيه التعليمات إليها باستخدام اللغة الطبيعية، وإذا كانت قادرة على التصرف بصورة مستقلة دون إشراف. وأخيراً، ينطبق مصطلح "وكيل" أيضاً على الأنظمة القادرة على استخدام الأدوات، مثل البحث عبر الإنترنت أو البرمجة، أو القادرة على التخطيط.
اقرأ أيضاً: كيف يمكن توظيف التفكير التأملي في تدريب نماذج الذكاء الاصطناعي؟
هل هذه الأنظمة جديدة؟
ظهر مصطلح "وكلاء الذكاء الاصطناعي" (AI agents) منذ عدة سنوات، وكان يحمل معاني مختلفة في أوقات مختلفة، كما يقول أستاذ علوم الكمبيوتر في جامعة واشنطن، شيراغ شاه.
وقد ظهرت موجتان من الوكلاء، على حد قول فان. تُعزى الموجة الحالية إلى ازدهار النماذج اللغوية، وظهور أنظمة مثل تشات جي بي تي.
أمّا الموجة السابقة فتعود إلى عام 2016، عندما أطلقت شركة جوجل ديب مايند (Google DeepMind) نظام الذكاء الاصطناعي ألفاغو (AlphaGo) الذي يستطيع أن يلعب لعبة غو، ويفوز فيها. كان ألفاغو قادراً على اتخاذ القرارات وتخطيط الاستراتيجيات. اعتمدت هذه الموجة على التعلم المعزز، وهو تقنية تكافئ خوارزميات الذكاء الاصطناعي لقاء السلوكيات المرغوبة.
يقول نائب رئيس الأبحاث في جوجل ديب مايند، أوريول فينيالس: "لكن نطاق مهام هؤلاء الوكلاء لم يكن عاماً". فقد صُمِّم هؤلاء الوكلاء لتنفيذ مهام محددة، وفي هذه الحالة، كانت المهمة لعب لعبة غو. أمّا الجيل الجديد من أنظمة الذكاء الاصطناعي الأساسية التي تعتمد على النماذج فقد أدّى إلى جعل نطاق عمل الوكلاء أشمل، حيث يستطيعون التعلم من العالم الذي يتفاعل معه البشر.
يقول فينيالس: "تعطي هذه الأنظمة انطباعاً أقوى بكثير بأنها تتفاعل مع العالم، ثم تقدّم لك إجابات أفضل أو تساعدك بصورة أفضل أو غير ذلك".
ما هي أوجه قصور هذه الوكلاء؟
ما زال هناك الكثير من الأسئلة التي تنتظر الإجابة. ووفقاً للرئيسة التنفيذية والمؤسسة لشركة الذكاء الاصطناعي إمبيو (Imbue)، كانجون تشيو، التي تعمل على تصميم وكلاء قادرين على التفكير والبرمجة، فإن الوضع الحالي للوكلاء يشبه وضع السيارات الذاتية القيادة منذ عقد ونيف. ففي كلتا الحالتين، ثمة مهام يمكن لهذه التكنولوجيات تنفيذها، لكنها ما زالت غير موثوقة، ولم تبلغ حد الاستقلالية التامة في عملها بعد من الناحية العملية. على سبيل المثال، يستطيع الوكيل المبرمج توليد الرموز البرمجية، لكنه يخطئ في بعض الأحيان، ولا يعرف كيف يختبر الرموز البرمجية التي ينشئها، على حد قول تشيو. ولهذا، ما زالت العملية بحاجة إلى مشاركة بشرية فعّالة. ما زالت أنظمة الذكاء الاصطناعي غير قادرة على التفكير بصورة تامة، وهي خطوة بالغة الأهمية للعمل ضمن عالم بشري معقد ويكتنفه الغموض.
يقول فان: "ما زلنا بعيدين كل البعد عن تصميم وكيل قادر على أتمتة هذه المهام الروتينية كلها من أجلنا ببساطة". فالأنظمة الحالية "تهلوس ولا تتبع التعليمات بدقة على الدوام أيضاً. وهذه المسألة باتت تمثل مصدر إزعاج"، كما يقول فان.
من أوجه القصور الأخرى أن وكلاء الذكاء الاصطناعي يفقدون مسار المهمة التي ينفذونها بعد مرور بعض الوقت. فعمل أنظمة الذكاء الاصطناعي محدود بنطاق السياق الذي توضع فيه، أي كمية البيانات التي يمكن أن تأخذها في الاعتبار في أي وقتٍ من الأوقات.
"يستطيع تشات جي بي تي كتابة الرموز البرمجية، لكنه لا يبلي حسناً إذا كان الأمر ينطوي على التعامل مع محتوى كبير الحجم. لكن بالنسبة إلى المطورين البرمجيين من البشر، فإننا نستعرض مستودعاً كاملاً في منصة غيت هاب (GitHub) يحتوي على العشرات من أسطر الرموز البرمجية، بل والمئات في بعض الأحيان، دون أن نواجه أي مشكلة في التعامل معها"، كما يقول فان.
لمعالجة هذه المشكلة، أعلنت جوجل أنها زادت قدرة نماذجها على معالجة البيانات، ما يُتيح للمستخدمين زيادة نطاق تفاعلها مع هذه النماذج، ويسمح للنماذج بتذكر المزيد حول التفاعلات السابقة. وقالت الشركة إنها تعمل على توسيع نطاق سياق العمل بحيث تصبح غير محدودة في المستقبل.
بالنسبة إلى الوكلاء المتجسدين، مثل الروبوتات، ثمة قيود وأوجه قصور إضافية حتى. فهناك مثلاً مشكلة نقص بيانات التدريب الضرورية لتعليمها، وقد بدأ الباحثون مؤخراً وحسب يستثمرون قدرات النماذج الأساسية في مجال الروبوتات.
لذا، وسط هذا الضجيج الإعلامي والحماس كله، يجدر بنا أن نأخذ في الاعتبار أن الأبحاث المتعلقة بوكلاء الذكاء الاصطناعي ما زالت في مراحل مبكرة جداً، ومن المرجّح أن يستغرق الأمر سنوات عديدة حتى نتمكن من تجربة إمكاناتهم الكاملة.
اقرأ أيضاً: ميتا تنافس تشات جي بي تي بنموذج ذكاء اصطناعي يتحدث 20 لغة
هل يمكنني أن أجرب وكيل ذكاء اصطناعي الآن على أي حال؟
إلى حد ما. من المرجّح أنه سبق لك أن جربت نماذج أولية لهؤلاء الوكلاء، مثل تشات جي بي تي وجي بي تي 4 (GPT-4) من أوبن أيه آي (OpenAI). تقول تشيو: "إذا كنت تتفاعل مع برنامج يوحي بأنه ذكي، فهذا البرنامج يُعَد نوعاً من أنواع الوكيل".
وتقول إن أفضل الوكلاء الموجودين لدينا حالياً يتمثلون في الأنظمة المخصصة لحالات استخدام محددة ومجالاتها ضيقة جداً، مثل البرمجة وبوتات خدمة العملاء أو برمجيات أتمتة سير العمل، مثل زابيير (Zapier)، على حد قول تشيو. لكنها بعيدة للغاية عن وكيل ذكاء اصطناعي عام قادر على تنفيذ مهام معقدة.
تقول تشيو: "لدينا حالياً أجهزة كمبيوتر قوية للغاية، لكننا في حاجة إلى إدارتها بصورة دقيقة".
من شأن الإضافات البرمجية المساعدة لتشات جي بي تي من أوبن أيه آي أن تُتيح للمستخدمين بناء مساعدات لمتصفحات الويب تعتمد على الذكاء الاصطناعي، وقد كانت أقرب إلى محاولة لتصميم الوكلاء، على حد تعبير تشيو. لكن هذه الأنظمة لا تزال خرقاء وغير موثوقة وغير قادرة على التفكير، على حد قول شو.
وعلى الرغم من هذا، تعتقد تشيو أن هذه الأنظمة ستؤدي يوماً ما إلى تغيير أسلوبنا في التفاعل مع التكنولوجيا، وهو توجه يجب علينا أن نوليه ما يستحق من الاهتمام والمتابعة.
وتقول: "لن نتوصل إلى تحقيق الذكاء الاصطناعي العام على حين غرة، بل بصورة تدريجية، حيث ستجد يوماً ما أن الكمبيوتر أصبح قادراً على تنفيذ مهام إضافية كثيرة مقارنة بما كان قادراً على تنفيذه قبل 5 أعوام على سبيل المثال".