على الرغم من التقدم الذي أحرزته بوتات الدردشة والمساعدات الافتراضية، إلا أنها لا تزال تُجري مُحاورة سيئة، فمعظمها موجَّه تماماً لتنفيذ مهام محددة: أنت تطلب شيئاً وهي تمتثل، وبعضها مُحبِط بشدة: لا يبدو أنها ستجد أبداً ما تبحث أنت عنه، والبعض الآخر مملٌّ تماماً: تفتقر إلى سحر الرفيق البشري. لا بأس بها إذا كنت تريد فقط ضبط جهاز توقيت، ولكن مع تزايد شعبية هذه البوتات باعتبارها واجهة لكل شيء -بدءًا بمتاجر التجزئة مروراً بخدمات الرعاية الصحية وحتى الخدمات المالية- فإن أوجه القصور فيها تزداد وضوحاً.
والآن، جعلت شركة فيسبوك بوت الدردشة الجديد الخاص بها "بليندر" مفتوح المصدر، مُدعية أنه يمكنه التحدث عن أي شيء تقريباً بطريقة جذابة وشيقة. ولا يستطيع بليندر معاونة المساعدات الافتراضية في حل العديد من أوجه القصور فيها فحسب، بل إنه يدل أيضاً على إحراز تقدم نحو الطموح الأكبر الذي يدفع الكثير من أبحاث الذكاء الاصطناعي: وهو محاكاة الذكاء. ويقول ستيفن رولر، مهندس الأبحاث في فيسبوك الذي شارك في قيادة المشروع: "إن إجراء حوار هو نوعاً ما مشكلة 'الذكاء الاصطناعي الكامل'. حيث يتوجب عليك حل كل 'مشاكل' الذكاء الاصطناعي لحل 'مشكلة' الحوار، وإذا تمكنت من حل 'مشكلة' الحوار، فقد قمت بحل كل 'مشاكل' الذكاء الاصطناعي".
مصدر الفيديو: فيسبوك
يستمد بليندر قدرته من الحجم الهائل لبيانات التدريب الخاصة به؛ حيث تم تدريبه في البداية على 1.5 مليار محادثة متاحة للجمهور على موقع ريديت (Reddit)، وذلك لإعطائه أساساً لعملية توليد الردود أثناء الحوار. ثم تم صقله بمجموعات بيانات إضافية تخص ثلاث مهارات: محادثات تحتوي على نوع من العاطفة لتعليمه إبداء التعاطف (على سبيل المثال، إذا قال المستخدم: "لقد حصلت على ترقية"، يمكن لبليندر أن يقول: "مبارك")، ومحادثات كثيفة المعلومات مع أحد الخبراء لإكسابه المعرفة، ومحادثات بين أشخاص ذوي شخصيات مختلفة لإكسابه الشخصية. والنموذج الذي نتج عن ذلك أكبر بـ 3.6 مرات من "مينا" بوت الدردشة الخاص بشركة جوجل، الذي تم الإعلان عنه في شهر يناير الماضي. كما أن بليندر كبير لدرجة أنه لا يمكن احتواؤه على جهاز واحد، ويجب تشغيله عوضاً عن ذلك باستخدام شريحتين حاسوبيتين.
كانت جوجل قد أعلنت، في ذلك الوقت، أن مينا هو أفضل بوت دردشة في العالم. بيد أن 75% من الأشخاص الذين شاركوا في عملية التقييم، في اختبارات فيسبوك الخاصة، وجدوا أن بليندر أكثر جاذبية من مينا، وقال 67% منهم إنه يبدو أكثر شبهاً بالإنسان. كما خدع بوت الدردشة أيضاً المقيِّمين البشريين في 49% من الحالات، ودفعهم إلى الاعتقاد بأن سجلات محادثاته "بشرية أكثر" من سجلات المحادثة بين أشخاص حقيقيين، وهو ما يعني عدم وجود الكثير من الفروقات النوعية بينهما. ولم ترد جوجل على طلب للتعليق حتى وقت نشر هذا المقال.
وعلى الرغم من هذه النتائج المبهرة، إلا أن مهارات بليندر لا تزال بعيدة كل البعد عن المهارات البشرية. فحتى الآن، قام الفريق بتقييم بوت الدردشة فقط خلال محادثات قصيرة تحتوي على 14 دورة كلامية. ويشك الباحثون في أنه إذا استمر في الدردشة لفترة أطول، فسرعان ما سيحيد عن المنطق. وتقول إميلي دينان القائدة الأخرى للمشروع: "هذه النماذج غير قادرة على التعمق بشكل كبير، وغير قادرة على تذكر سجل المحادثة إلى ما هو أبعد من عدة دورات".
يميل بليندر أيضاً إلى "الهلوسة" في المعلومات أو اختلاق الحقائق، وهو ما يفرض قيداً مباشراً على تقنيات التعلم العميق المستخدمة في بنائه؛ إذ إنه يولّد الجُمل في نهاية المطاف من الارتباطات الإحصائية، وليس من قاعدة بيانات معرفية. ونتيجة لذلك، فقد يدمج وصفاً تفصيلياً ومتماسكاً لأحد المشاهير على سبيل المثال بمعلومات خاطئة تماماً. ويخطط الفريق لتجربة دمج قاعدة بيانات معرفية في عملية توليد ردود بوت الدردشة.
ثمة تحدٍّ رئيسي آخر يواجه أي بوت دردشة يستخدم نظاماً مفتوحاً، يتمثل في منعه من قول كلمات مؤلمة أو متحيزة. ونظراً لأن هذه الأنظمة يتم تدريبها في نهاية المطاف على وسائل التواصل الاجتماعي، فقد ينتهي بها الأمر إلى اجترار الانتقادات الفظة التي تعج بها شبكة الإنترنت. (وقد أساء هذا الأمر لسمعة بوت دردشة مايكروسوفت، المعروف باسم تاي، عام 2016). وقد حاول الفريق معالجة هذه المشكلة عن طريق مطالبة العاملين بتصفية الكلمات المؤذية في مجموعات البيانات الثلاثة المُستخدمة في صقل قدرات بليندر، لكنه لم يفعل نفس الشيء في مجموعة البيانات التي حصل عليها من موقع ريديت بسبب حجمها الضخم (وأي شخص قضى الكثير من الوقت على ريديت سيعرف لماذا يمثل هذا الأمر إشكالية).
ويأمل الفريق في تجربة آليات أمان أفضل، بما في ذلك أداة تصفية للكلمات المؤذية يمكنها مراجعة ردود بوت الدردشة. ومع ذلك، يعترف الباحثون بأن هذا النهج لن يكون شاملاً؛ ففي بعض الأحيان قد تبدو جملة على غرار "نعم، هذا رائع" جيدة، إلا أن استخدامها في سياق حساس -مثل الرد على تعليق عنصري- يمكن أن يحمل معاني مؤذية.
على المدى الطويل، يرغب فريق الذكاء الاصطناعي في فيسبوك أيضاً في استحداث برامج محادثة أكثر تطوراً يمكنها الرد على الإشارات البصرية، فضلاً عن الكلمات. وعلى سبيل المثال، يطور أحد المشروعات نظاماً يسمى دردشة الصور (Image Chat) يمكنه التحدث بعقلانية عن الصور التي قد يرسلها إليه المستخدم.