تتصاعد الأغنية القصيرة التالية على البيانو بشكل مرح، لتنتهي بخاتمة مليئة بالنغمات المختلفة، بشكل يوحي وكأنها لحن لحملة إعلانية عن معجون أسنان جديد.
غير أن هذا اللحن، في الواقع، هو من تأليف برنامج ذكاء اصطناعي موسيقي من جوجل. وتثبت مؤلفات هذا البرنامج التي صدرت في أواخر العام 2016، كيف يمكن إنتاج عمل إبداعي يبدو قريباً إلى عمل البشر إلى حد كبير، وذلك بالجمع ما بين طرق التعلم الآلي والقواعد الموسيقية البسيطة.
يعتبر التأليف الموسيقي أحد الأشكال الغامضة من الإبداع البشري. وعلى الرغم من أن برامج تأليف الأغاني موجودة منذ بعض الوقت، فهي تتبع مجموعة محددة من القواعد، وغالباً ما تنتج ألحاناً تبدو جامدة وميكانيكية الطابع، وهو ما ينطبق ايضاً على برامج توصية الموسيقى التي تعمل بناء على عاداتك في الاستماع (انظر مقالة: "الكذبة الموسيقية"). ويمكن أن يؤدي تعليم الحواسيب اكتساب حس موسيقي أكثر ابتكاراً إلى أساليب لعمل الآلات في مجالات ابتكارية أخرى، بدءاً من تصميم المنتجات وصولاً إلى كتابة النصوص البليغة.
عرضت جوجل سابقاً برنامجها الذي يعتمد على الذكاء الاصطناعي لتأليف الموسيقى، وهو جزء من مشروع ماجينتا الذي يهدف إلى تعزيز الإبداع الآلي (انظر مقالة: "حسناً أيها الحاسوب، ألّف أغنية لي"). يتم تلقيم شبكة عصبونية كبيرة بعشرات الآلاف من الأغاني وتدريبها على توقع النغمة التالية في تتابع من النغمات. ويمكن لشبكة كهذه أيضاً أن تولد موسيقى جديدة إذا أُعطيت نقطة بداية، على الرغم من أن النتائج ما زالت تفتقر إلى الهيكلية والانسيابية.
قام دوجلاس إيك أواخر العام 2016 -وهو باحث علمي في جوجل ويشرف على تطوير الذكاء الاصطناعي لتوليد الموسيقى- بالاشتراك مع ناتاشا جاك، وهي متدربة في الشركة، بتطوير طريقة تجعل من أنظمة تأليف الأغاني قادرة على إنتاج ألحان أكثر جمالاً وجاذبية. فقد استخدموا طريقة التعلم المعزز لإضافة مبادئ بسيطة من نظرية الموسيقى –مثل تجنب تكرار اللازمة الموسيقية كثيراً، أو المبالغة في سرعة أو بطء اللحن، وغير ذلك- إلى عملية التعلم الكلية. حيث تتلقى الشبكة جائزة إيجابية في كل مرة تنتج فيها تتابعاً من النغمات الموسيقية يشبه الأنماط الموجودة في الأغاني السابقة، ويلتزم بالقواعد الموسيقية المعطاة لها.
يقول إيك: "هذه قواعد بسيطة من كتاب حول التأليف الموسيقي. وإذا جمعنا هذه القواعد مع التعلم المعزز، إضافة إلى تقلبات العالم الحقيقي التي نحصل عليها من آلاف الأغاني التي ألفها البشر، سنحصل على أغاني جذابة للغاية".
لا شك في أن هذه الطريقة الجديدة -والتي تحدث عنها الباحثان في هذا البحث إضافة إلى منشور في مدونة- ستحسن، كما يبدو، من عملية التوليد الموسيقي الآلي. ويبين مقطع موسيقي قصير آخر أداء البرنامج بدون اتباع هذه القواعد. حيث تبدو هذه المقطوعة مملة وتكرارية وآلية. أجرى إيك وجاك أيضاً دراسة على المستخدمين، ووجدوا أن الناس يفضلون بشكل كبير المقطوعات التي أُنتجت بالطريقة الجديدة.
يقول إيك إن القدرة على إدماج القواعد في عملية التعلم المعزز ستكون مفيدة في عدة مجالات، مثل الروبوتات، وأنظمة التوصية، والترجمة.
يعمل يورجن شميدهوبر كبروفسور في جامعة لوجانو السويسرية، وهو من رواد الأبحاث في هذه الشبكات العصبونية التي يستخدمها باحثا جوجل، كما أجرى اختبارات على الابتكار باستخدام التعلم المعزز، ويقول: "لا يوجد سبب يمنع الآلات من أن تكون فضولية ومبدعة". ويضيف شميدهوبر أن هذه الطريقة يمكن أن تتجاوز في تطبيقاتها المجال الموسيقي: "يمكن أن نتخيل استخدام تركيبات مشابهة من الشبكات العصبونية والأنظمة الخبيرة المبنية على القوانين لتشخيص الأمراض".
يمثل التعلم المعزز طريقة تمكننا من تعليم الأشياء كيفية أداء مهام معينة لا يمكن تحقيقها باستخدام التعليمات المباشرة والواضحة. وقد استُخدمت هذه الطريقة في ألفاجو، وهو برنامج طوره باحثو جوجل للعب اللعبة اللوحية القديمة جو. وعلى الرغم من أن قواعد جو بسيطة، فمن الصعب أن تشرح للبرنامج كيف يلعب بطريقة جيدة، وعادة ما يطور اللاعبون قدرات حدسية عن طريق ساعات طويلة من اللعب. ولكن في بعض الأحيان، قد يكون من المفيد أيضاً تقديم تعليمات مباشرة إلى نظام التعلم الآلي.
يقول ستيفان هارناد، وهو بروفسور مختص بعلم النفس في جامعة كيبيك في كندا، وأجرى دراسات على الإبداع الاصطناعي، إن عمل مشروع ماجينتا مثير للإعجاب، ولكنه يضيف أنه ما زال أمامنا طريق طويل يجب أن نقطعه قبل أن تصبح الحواسيب قادرة على أن تبدع بشكل حقيقي يضاهي البشر، ويقول: "على الرغم من أن خوارزميات التعلم العميق واعدة وتتميز بإمكانات كبيرة، فإنها لم تتمكن حتى الآن من محاكاة القدرات البشرية العادية غير الابتكارية، ولهذا قد يكون من المبكر بعض الشيء أن نتوقع منها أن تبدع". وفي الواقع، يقول هارناد إن جميع المقطوعات الموسيقية التي ألفتها الآلات، بما فيها تلك التي أنتجها فريق جوجل، غالباً ما تبدو جامدة وميكانيكية بعد الاستماع إليها لبضع مرات.