تركز الكثير من أبحاث السيارات ذاتية القيادة على سلامة المشاة، ولكن من المهم الأخذ بعين الاعتبار سلامة الركاب وراحتهم أيضاً. عند الضغط على المكابح لتجنب الاصطدام، على سبيل المثال، يجدر بالسيارة في الحالة المثالية أن تصل إلى وضعية التوقف بطريقة انسيابية وليس عنيفة. بلغة التعلم الآلي، فإن هذه الفكرة تمثل مشكلة متعددة الأهداف؛ الهدف الأول هو: تجنب المشاة، والهدف الثاني هو: ليس على حساب سلامة الركاب.
وقد تعامل عدد من الباحثين في جامعة رايرسون في تورونتو مع هذا التحدي بالاعتماد على التعلم المعزز العميق. إذا عدنا بالذاكرة، فإن التعلم المعزز هو فئة فرعية من التعلم الآلي تستخدم أسلوب المكافأة والعقاب لتعليم وسيط الذكاء الاصطناعي كيفية تحقيق هدف معين أو مجموعة من الأهداف.
في هذه الحالة قام الباحثون "بمعاقبة" السيارة في كل مرة اصطدمت فيها بأحد المشاة (مع تحديد عقوبات أشد قسوة في حالات الاصطدام ذات السرعات الأعلى)، وأيضاً لقاء التسبب في خضات عنيفة أثناء عملية الفرملة (مع تحديد عقوبات أشد في حالات التوقف الأكثر عنفاً).
ثم قام الباحثون باختبار النموذج الذي اعتمدوه في بيئة افتراضية مع عمليات محاكاة مبنية على بيانات حقيقية للمشاة الذين يعبرون الطريق، وتمكن نموذجهم من تجنب جميع الحوادث بنجاح، مع التخفيف بشكل متزامن من الخضخضة الناجمة عن الفرملة مقارنة بنموذج آخر لم يأخذ بعين الاعتبار راحة الركاب.
هذا العمل يقدم برهاناً على صحة التصور المتعلق بكيفية منح الركاب تجربة ركوب أفضل دون إغفال السلامة الإجمالية للقيادة، ولا شك أن اختبار الفكرة في العالم المادي الحقيقي يتطلب إنجاز المزيد من العمل.