خوارزمية تعلم عميق من أوبن إيه آي تؤلف أغاني البوب

2 دقائق
مصدر الصورة: غيتي إيميدجيز

يقول الخبر

في مقاربة جديدة حول التأليف الآلي لموسيقا البوب، أطلقت أوبن إيه آي شبكة عصبونية تحمل اسم جيوكبوكس، تستطيع توليد أغاني جذابة من العديد من الأنماط الموسيقية، بدءاً من أغاني تيني بوب والكاونتري، وصولاً إلى الهيب هوب والميتال، بل إنها حتى تستطيع الغناء... نوعاً ما.

كيف تعمل

يجب أولاً أن تُلقم جيوكبوكس باللون الموسيقى المطلوب واسم الفنان والكلمات، وستنتج عملاً يحاكي أسلوب بعض الفنانين المعروفين، مثل كيتي بيري وإلفيس بريسلي وناس. يمكن أيضاً تلقيمها بأول بضعة ثواني من الأغنية، وستقوم تلقائياً بإكمالها.

أغانٍ قديمة وحيل جديدة

لطالما كانت الموسيقى التي تولدها الحواسيب محط اهتمام الكثيرين منذ 50 سنة على الأقل، وقد قدمت أنظمة الذكاء الاصطناعي أمثلة مثيرة للإعجاب من الأعمال ذات الطابع الكلاسيكي أو الإلكتروني. غالباً ما تعتمد ألعاب الفيديو على موسيقى يولدها الحاسوب وتُسمع في الخلفية، حيث تُشغل بشكل متكرر أو تتصاعد استجابة لما يقوم به اللاعب في تلك اللحظات. غير أن توليد مقطوعة تشبه أعمال باخ أسهل بالنسبة للآلة من توليد لحن يشبه ألحان أغاني فرقة البيتلز، ويعود هذا إلى أن الأساس الرياضي للموسيقى ذات الطابع الأقرب إلى الكلاسيكي يعتمد بشكل أساسي على التمثيل الصوري للموسيقى، الذي غالباً ما يُستخدم في أنظمة الذكاء الاصطناعي التي تؤلف الموسيقى. وعلى الرغم من أن أغاني البوب أكثر بساطة، فإنها مختلفة تماماً.

قامت أوبن إيه آي بتدريب جيوكبوكس باستخدام 1.2 مليون أغنية، مستخدمة البيانات الصوتية الخام بحد ذاتها بدلاً من التمثيل المجرد للنغمة أو الآلة الموسيقية أو التوقيت. ولكن هذا يتطلب شبكة عصبونية قادرة على التقاط ما يسمى التبعيات -أي الأنغام المتكررة- عبر أغنية بوب نموذجية تدوم لثلاث أو أربع دقائق، وهو أمر صعب بالنسبة للذكاء الاصطناعي. وحتى نعطي فكرة أكثر وضوحاً عن حجم المهمة، نذكر أن جيوكبوكس تتابع ملايين العلامات الزمنية في الأغنية، وهو رقم هائل بالمقارنة مع مولد اللغة جي بي تي 2 من أوبن إيه آي، الذي يتتبع الكتابة معتمداً على الآلاف من العلامات الزمنية.

بوتات مغنية

ولكن بصراحة، فإن هذا النظام أبعد ما يكون عن الكمال. وستلاحظ أن النتائج -وعلى الرغم من كونها مثيرة للإعجاب من الناحية الفنية- توحي بانطباع آلي يقترب من تقليد البشر إلى درجة مثيرة للنفور.

وعلى الرغم من أننا ما زلنا بعيدين عن تحقيق الذكاء الاصطناعي العام (وهو الهدف المعلن لأوبن إيه آي)، فإن جيوكبوكس تُثبت مرة أخرى أن الشبكات العصبونية أصبحت أكثر براعة في تقليد البشر، وبدأت بمحو الحدود الفاصلة بين ما هو حقيقي وغير حقيقي. وعلى سبيل المثال، رفع مغني الراب جاي زي مؤخراً دعوى قانونية لحذف مقاطع عميقة التزييف يظهر فيها وهو يغني أغاني لبيلي جويل. وتقول أوبن إيه آي إنها تخطط لإجراء أبحاث حول تأثير الذكاء الاصطناعي على حقوق حماية الملكية.

المحتوى محمي