جوجل تختبر ذكاءها الاصطناعي “دوبلكس” الذي يبدو كإنسان

5 دقائق
مصدر الصورة: ماجيكون/ إدوين باريوجي إم/ ديميك داكنسيا/ ذا ناون بروجيكت

قال الصوت الأنثوي المهذب على الطرف الآخر من الخط: "مرحباً، أنا أتصل لأجري حجزاً". وهكذا وجدت نفسي أتعرّف على أحدث تحف الذكاء الاصطناعي من جوجل، وهو متسابق اختبار تورينغ الذي يمكنه توليد مقاطع صوتية مالئة أثناء المحادثة والمعروف باسم "دوبلكس".

عندما تقوم جوجل بتقديمه إلى بعض المستخدمين لاختباره في الأسابيع المقبلة، سيكون دوبلكس أداةً ضمن التطبيق مساعد جوجل والتي يمكن للمختبِرين استخدامها للاتصال بالمتاجر بالنيابة عنهم ومعرفة ساعات العطلة الخاصة بها. في وقت لاحق من هذا الصيف، سيكون قادراً أيضاً على الاتصال بالمطاعم وصالونات الحلاقة لإعداد الحجوزات ومواعيد تصفيف الشعر.

تم كشف الستار عنه في مؤتمر الشركة السنوي للمطورين ليحظى بالحدث بضجة إعلامية كبيرة، وفي الأيام اللاحقة حظي أيضاً بالكثير من الاهتمام. وبعد عرضه التجريبي المثير للإعجاب، عبر الناس عن مخاوفهم بشأن أسلوبه المشابه كثيراً للبشر (حيث يكمل كلامه بأصوات مثل "أممم" و"آه") وكيف أنه لم يعرف عن نفسه كمُعين للذكاء الاصطناعي (AI Agent).

حاولت جوجل منذ ذلك الحين تهدئة المخاوف، ومع تضاعف الانتقادات الأخلاقية خلال الأيام التي تلت العرض التجريبي، صدر رد الشركة سريعاً بأن دوبلكس سيقدم نفسه للشخص المتصل على أنه مُعين ذكي ويصرح بأن المكالمة سيتم تسجيلها.

وفي 26 يونيو الماضي، دعت جوجل مجموعة من المراسلين إلى متجر أورينز هوموس الذي عادة ما يكون مزدحماً وسط مدينة ماونتن فيو في ولاية كاليفورنيا، لعرض التقدم الذي أحرزه دوبلكس. وبينما تواجد خارج المتجر عدد من العملاء المحتملين الذين منعوا من الدخول، قدم أعضاء من فريق مساعد جوجل للمراسلين عرضاً عن كيفية عمل النظام وسمحوا لنا بتجربته بأنفسنا داخل المطعم.

أحد التغييرات الكبيرة التي أُحدثت منذ العرض التجريبي لدوبلكس في شهر مايو الماضي، هو أن المكالمات التي سمعتها (إضافة إلى مكالمة واحدة قمت بالرد عليها) كان واضحاً أن من قام بها كان مُعيناً ذكياً. فخلال المكالمة التي رددت عليها متظاهراً بأنني مضيفة مطعم، سرعان ما قال الصوت الأنثوي المتحدث إنه خدمة آلية تقوم بتسجيل المكالمة (هذا الفيديو من جوجل يعطي فكرة عن مظهر المعين الذكي وصوته؛ وقد تمكنت من تسجيل الصوت بهدف تدوين الملاحظات، ولكن جوجل طلبت مني عدم مشاركة التسجيل كشرط منها لكي أتمكن من حضور العرض التجريبي).

يقول نيك فوكس، نائب رئيس الإنتاج والتصميم في مشروع مساعد جوجل؛ إن جوجل علمت منذ شهر مايو الماضي أنها بحاجة للإفصاح عن أن المكالمات صادرة عن كيان يتمتع بالذكاء الاصطناعي، وأنه تم "التحقق" من هذه الحاجة بعد كشف الستار عن الخدمة في مؤتمر المطورين.

يقول فوكس: "أنا لا أقول إننا غيرنا أي شيء بالضرورة بناءً على التعليقات وردود الأفعال التي تلقيناها". ويقول إن الشركة قدمت العرض التجريبي الأصلي من دون ذلك الإخطار لأنها كانت تحاول في ذلك الوقت عرض التكنولوجيا بدلاً من عرض المنتج النهائي.

خلال مكالمتي، حاولت أن أصعب الأمر على الصوت الصادر من الطرف الآخر، متظاهراً بأنني لم أتمكن من سماع التفاصيل مثل الموعد الذي أراد الذكاء الاصطناعي أن يحجز طاولة فيه، لأعرف فقط ما الذي سيحدث. هل سيبقى يتصرف كالبشر؟ (تقول جوجل إن هذا لا يزال يحدث في واحدة من أصل خمس مكالمات اختبار يجريها دوبلكس، ولكنها لا تقول أكثر من ذلك عن هذه المُعِينات)

هل سينهي المكالمة ببساطة إذا تسببت له بالإرباك أكثر من اللازم؟ (لم يحدث معي هذا، ولكنه حدث مع مراسل آخر، والذي أخبر الذكاء الاصطناعي بأن المطبخ في المطعم التخيلي سيكون مغلقاً بعد وقت معين ولن يكون متوفراً إلا قائمة المشروبات فقط).

بشكل عام، قام دوبلكس بما كان من المفترض أن يقوم به. فقد كرر ما قاله عندما طلبت منه ذلك. لم ينزعج عندما طلبت منه الانتظار، ولم يخطئ في الألفاظ عندما كنت أتلعثم بالكلمات التي أنطقها. وعندما قلت له إنني لا أستطيع الحجز لخمسة أشخاص يوم الأحد حتى الساعة الثامنة مساءً، بدلاً من الموعد المطلوب وهو الساعة السادسة مساءً، بقي راغباً بالحصول على حجز.

لقد أعجبت بالطابع البشري لصوته، لقد بدا وكأنه شخص حقيقي فعلاً (على الرغم من أنني سمعته خلال إحدى المكالمات الاختبارية وقد بدا حاسوبي المنشأ بوضوح عند نطق أحد أرقام الهواتف).

قام سكوت هوفمان، نائب رئيس قسم الهندسة في مشروع مساعد جوجل، بتشغيل تسجيل صوتي لمجموعتنا المحتشدة يعود لإصدار قديم من دوبلكس – صوت ذكري بلكنة بريطانية وأسلوب منمق من السهل التيقن بأنه كان حاسوبي المنشأ – وقال إن هذا النوع من الأصوات التي لا تتمتع بطابع بشري لا يجدي نفعاً مع المشاريع التجارية. وفقاً لهوفمان، فإن الكثير من الناس كانوا ينهون مكالماتهم، من دون إتمام عمليات الحجز.

يقول هوفمان: "لم يتعاطى الناس بشكل جيد الطابع المصطنع لصوته". وقد تحسنت الأشياء كثيراً على ما يبدو، فها هو الذكاء الاصطناعي قد تم تصنيعه ليبدو أشبه بشخص حقيقي.

وعلى الرغم من أن الأصوات "أممم" و "آه" الصادرة عن ذكاء اصطناعي سمعي قد تخيفك، إلا أن هوفمان يقول إن هذه التشنجات اللا إرادية المبرمجة تهدف إلى المضي بالمحادثة بشكل سلس. على سبيل المثال، قد يبدو أكثر تهذيباً أن تصحح لأحد الأشخاص بالقول: "آه، لخمسة أشخاص"، بدلاً من القول: "لا، لخمسة أشخاص"، عند إجراء حجز للعشاء.

ومع ذلك، وعلى الرغم من أن دوبلكس يتضمن الآن خصائص صوتية بشرية، إلا أنه يواجه مشكلة في فهم بعض الأسئلة التي لا تسبب الإرباك لي ولك. فعندما سألته ما إذا كانت المجموعة ستتضمن أولاداً، وما إذا كان هناك حاجة لوضع كرسي مرتفع، أجاب الصوت الأنثوي بأنه يطلب الحجز بالنيابة عن أحد الزبائن، ولا يعرف الإجابة (طرح مراسل آخر سؤالاً مماثلاً وحصل على نمط مماثل من الإجابة).

وعندما سألته ما إذا كان هناك أية حاجات خاصة لتسهيل الدخول، كأن يكون أحد أفراد المجموعة يستخدم كرسي متحركاً، لم يتمكن من الإجابة على سؤالي أيضاً.

حيث قال الصوت عندها: "في الحقيقة لا أعلم، أنا آسف".

عندما يتم نشر دوبلكس، سيكون هناك جوانب من القصور، ولن تتوفر الفرصة لإجراء محادثات حقيقية. إذا حاولت أن تسأل عن شيء يتعلق بموضوع مختلف عن ساعات العطلة الخاصة بالمتاجر، أو حجوزات المطاعم، أو مواعيد تصفيف الشعر، فوفقاً لهوفمان، سيحاول دوبلكس إعادة توجيه المحادثة إلى المهمة المكلف بها. يقول هوفمان: "إنه يشبه شخصاً في غاية الغرابة لا يستطيع القيام إلا بهذه الأشياء الثلاثة".

على الرغم من أن العرض التجريبي كان في أغلبه إيجابياً، لا يزال هناك العديد من العقبات التي ينبغي التغلب عليها قبل أن يزدحم مطعم التاكو المكسيكي (قد يكون مطعماً للشاورما والبروستد) في منطقتك بطلبات الحجوزات التي يجريها الذكاء الاصطناعي. وتشمل هذه العقبات مخاوف عملية، مثل قوانين الخصوصية والأشخاص الذين يردون على المكالمات الهاتفية الذين يفضلون التفاعل البشري (الشركات التي لا ترغب ببساطة بقبول المكالمات من الذكاء الاصطناعي لجوجل ستتمكن من إلغاء الاشتراك). وليس بإمكان جوجل أن تطرح ميزة دوبلكس في أي مكان ترغب به، فالشركة سوف تحتاج إلى تصريح قبل أن تتمكن من تشغيله في تكساس على سبيل المثال.

كما أنه لا يزال مجهولاً بالنسبة لنا مدى فهم دوبلكس لمحادثاتنا. فبالرغم من أنني تمكنت من جعل الذكاء الاصطناعي على الطرف الآخر من الخط يؤكد لي بصوت واضح موعد الحجز وتاريخه خلال الدردشة التي دارت بيننا، إلا أن جوجل لمم توضح خلال عرضها التجريبي ما الذي فهمه دوبلكس من محادثاتنا بعد أن أنهينا مكالماتنا. على سبيل المثال، أنا لست متأكداً من أن "عميله" البشري الذي حصل على حجز لخمسة أشخاص قد أضيف إلى الجدول الزمني للمعين الذكي.

ثم هناك أيضاً المخاوف المتعلقة بصمود هذه الخدمة. فجوجل دوبلكس يبدو ابتكاراً حديث العهد الآن، وبالتالي قد يبقى الناس على الخط عندما تتصل، ولكن متى سيتم التعامل معها وتجاهلها مثلما يحدث في حالة المكالمات الروبوتية المتعلقة بالدراسات الاستقصائية؟

يعتقد هوفمان على الأقل، إنها لن تكون بذلك بالأمر الجلل بالنسبة لعمال المطاعم المشغولين، والذي يرغبون ببساطة بتدوين طلب حجز. ويقول إن متلقي المكالمات الاختبارية لم يظهروا ردود أفعال كبيرة لدى سماعهم بأن نظاماً للذكاء الاصطناعي يتصل ليحجز طاولة في المطعم.

يقول هوفمان: "يريد الناس تنفيذ المهمة فقط".