يُبرز فيلم "الجليد" (The Frost) أجواءه الغريبة والمريبة في لقطاته الأولى. الجبال الجليدية الشاسعة، ومخيّم مؤقت يحتوي على الخيام ذات الطراز العسكري، ومجموعة من الناس يتجمعون حول النار، والكلاب التي تنبح. كلها مناظر مألوفة، لكنها غريبة بما يكفي لتوليد شعور متعاظم من الرهبة؛ إذ إنها تُبيّن أن شيئاً ما ليس على ما يُرام في هذا المكان.
يقول أحدهم: "أعطني الذيل"، ثم تنتقل الكاميرا إلى لقطة قريبة لرجل بجانب النار يقضم قطعة وردية من اللحم. إنه منظر بشع، ولا تتحرك شفتا الرجل بشكلٍ صحيح تماماً. وللحظة، يبدو أنه يمضغ لسانه المتجمد.
العالم المقلق لصناعة الأفلام بالذكاء الاصطناعي
مرحباً بك في العالم المقلق لصناعة الأفلام بالذكاء الاصطناعي. يقول الموظف في شركة واي مارك (Waymark)، وهي شركة إنشاء الفيديو التي مقرها مدينة ديترويت التي أنتجت فيلم الجليد، ستيفن باركر: "وصلنا نوعاً ما إلى مرحلة توقفنا فيها عن مقاومة رغبتنا في الحصول على الدقة في التصوير الفوتوغرافي وبدأنا بالميل نحو النتائج الغريبة التي يولّدها نموذج دال-إي".
تبلغ مدة هذا الفيلم 12 دقيقة، وأنشأ الذكاء الاصطناعي المولّد للصور كل لقطة فيه. هذا الفيلم هو واحد من أكثر الأمثلة غرابة وإثارة للإعجاب حتى الآن في هذا النمط الفني الجديد والغريب، ويمكنك مشاهدته أدناه في كشف حصري من موقع إم آي تي تكنولوجي ريفيو.
كيف صنع الذكاء الاصطناعي فيلم الجليد؟
لصنع فيلم الجليد، استخدم الخبراء في شركة واي مارك نصاً من تأليف المنتج التنفيذي للشركة ومخرج الفيلم، جوش روبن، ثم أدخلوه في نموذج دال-إي 2 (DALL-E 2) المولّد للصور الذي صممته شركة أوبن أيه آي. وبعد أن أجرى صانعو الأفلام بعض التجارب لدفع نموذج دال-إي 2 لتوليد صور بأسلوب يناسبهم، استخدموا هذا النموذج لتوليد كل لقطة في الفيلم. ثم استخدموا أداة دي-آي دي (D-ID)، وهي أداة ذكاء اصطناعي تُضيف الحركة إلى الصور الثابتة، لتحريك هذه اللقطات، أي لجعل الخيام ترفرف في الهواء والشفاه تتحرك وما إلى ذلك.
يقول روبن: "صممنا عالماً من النتائج التي ولّدها نموذج دال-إي. إنها جمالية غريبة، ولكننا أُعجبنا بها كثيراً؛ إذ إنها أصبحت تمثّل المظهر العام للفيلم".
تقول صانعة الأفلام المستقلّة وواحدة من مؤسسي شركة بيل آند ويسل (Bell & Whistle) الاستشارية المتخصصة في التكنولوجيات الإبداعية، سوكي مهداوي: "هذا بالتأكيد هو أول فيلم ينتجه الذكاء الاصطناعي التوليدي يبدو فيه الأسلوب متسقاً. يضفي إنشاء الصور الثابتة وتحريكها على هذا الفيلم طابع الصور المجمّعة المسلي".
اقرأ أيضاً: نموذج جديد يعتمد على الذكاء الاصطناعي التوليدي قد يُحدث نقلة نوعية في إنتاج مقاطع الفيديو
ينتمي فيلم الجليد إلى مجموعة من الأفلام القصيرة التي أنتجها صناع الأفلام بمساعدة العديد من أدوات الذكاء الاصطناعي التوليدي التي أُصدرت في الأشهر القليلة الماضية. تنتج أفضل نماذج مقاطع الفيديو التوليدية المقاطع التي لا تتجاوز مدتها بضع ثوانٍ فقط. لذلك، تعتمد المجموعة الحالية من الأفلام على مجموعة متنوعة من الأساليب والتقنيات؛ بدءاً من تسلسلات الصور الثابتة الشبيهة بالقصص المصورة، مثل تلك المستخدمة في فيلم الجليد، إلى المقاطع التي تتشكل بدمج العديد من مقاطع الفيديو المختلفة التي تبلغ مدتها عدة ثوانٍ.
استضافت شركة رنواي (Runway)، وهي شركة تصمم أدوات الذكاء الاصطناعي المتخصصة بإنتاج الفيديو، مهرجان أفلام الذكاء الاصطناعي في مدينة نيويورك في شهري فبراير/ شباط ومارس/ آذار 2023. تشمل الإنتاجات البارزة فيلم "بي إل إس تي سي" (PLSTC) من إنتاج لاين سانشيز، وهو سلسلة مذهلة من صور الكائنات البحرية الغريبة المغلّفة بالبلاستيك التي أنشأها نموذج تصميم الصور ميدجورني (Midjourney)، والفيلم الخيالي "معطى مجدداً" (Given Again) من إنتاج جيك أولسون، المعتمد على تكنولوجيا تحمل اسم حقول الإشعاع العصبي (NeRF) (نيرف، neural radiance fields) التي تحوّل الصور الثنائية الأبعاد إلى كائنات افتراضية ثلاثية الأبعاد، وفيلم الحنين السريالي "طفولة ممتدّة" (Expanded Childhood) من إنتاج سام لوتون، وهو عرض شرائح لصور عائلة لوتون القديمة التي استخدم المنتِج نموذج دال-إي لجعلها تمتدُ لما بعد حدودها، ما أتاح له التلاعب بتفاصيل الصور القديمة التي لا يتذكّرها أحد بدقة.
فيلم "طفولة ممتدّة"/ سام لوتون
عرض لوتون الصور على والده ووثّق ردة فعله في الفيلم؛ إذ قال الأب: "هناك شيء ما خاطئ. لا أعلم ما هذا. هل أنا لا أذكر هذه الصور ببساطة؟"
اقرأ أيضاً: كيف يغيّر الذكاء الاصطناعي صناعة السينما؟
تقنية سريعة وغير مكلفة
الفنانون هم غالباً أول من يختبر التكنولوجيات الجديدة، لكن قطاع الإعلان هو الذي سيحكم تطور مجال مقاطع الفيديو المولّدة في المستقبل القريب. أنتجت شركة واي مارك فيلم الجليد لاستكشاف طرق لدمج الذكاء الاصطناعي التوليدي في منتجاتها. تصمم الشركة أدوات إنشاء الفيديو لصالح الشركات التي تبحث عن طرق سريعة ومنخفضة التكلفة لإنتاج الإعلانات التجارية. واي مارك هي واحدة من العديد من الشركات الناشئة، إلى جانب شركات مثل سوفت كيوب (Softcube) وفيديا أيه آي (Vedia AI)، التي تقدّم إعلانات الفيديو للعملاء حسب الطلب بنقرات قليلة فقط.
تجمع التكنولوجيات الحالية التي تستخدمها هذه الشركة، التي أُصدرت في بداية عام 2023، بين العديد من تقنيات الذكاء الاصطناعي المختلفة، مثل النماذج اللغوية الكبيرة والتعرّف على الصور وتركيب الكلام، وذلك لإنشاء إعلان الفيديو بسرعة. وتعتمد الشركة أيضاً على مجموعة البيانات الكبيرة الخاصة بها من الإعلانات التجارية التي لم تنشئها أدوات الذكاء الاصطناعي وصُممت للعملاء السابقين. يقول الرئيس التنفيذي للشركة، أليكس بيرسكي-ستيرن: "لدينا مئات الآلاف من مقاطع الفيديو، وانتقينا الأفضل منها واستخدمناها لتدريب أدواتنا على تمييز المقاطع العالية الجودة".
لاستخدام إحدى الأدوات التي تقدّمها الشركة ضمن خدمة اشتراك متعددة الطبقات تبدأ من 25 دولاراً شهرياً، يقدّم المستخدمون عناوين الويب أو حسابات الوسائل الاجتماعية لشركاتهم، ثم تبدأ هذه الأداة بجمع كل النصوص والصور التي يمكن العثور عليها. تستخدم الأداة بعد ذلك البيانات لتوليد إعلان تجاري، مستعينة بنموذج جي بي تي-3 (GPT-3) من شركة أوبن أيه آي لكتابة نص مكالمة مبيعات يُقرأ بصوت عالٍ اصطناعي مع عرض صور محددة تسلّط الضوء على خدمات الشركة. يمكن إنشاء إعلان تجاري عالٍ الجودة مدته دقيقة في ثوانٍ. يستطيع المستخدمون تعديل الإعلان إذا رغبوا في ذلك، وتعديل النص والصور واختيار صوت مختلف وما إلى ذلك. تقول الشركة إن عدد مستخدمي أداتها تجاوز 100 ألف مستخدم حتى الآن.
اقرأ أيضاً: ما مصير الذكاء الاصطناعي التوليدي بعد أن يخبو الضجيج الإعلامي؟
وفقاً لباركر، تكمن المشكلة في أنه لا تمتلك كل الشركات مواقع الويب أو الصور التي يمكن الاستفادة منها؛ إذ يقول: "قد لا يمتلك محاسب أو معالج أي أصول على الإطلاق".
تتمثل خطوة واي مارك التالية في استخدام الذكاء الاصطناعي التوليدي لإنشاء الصور ومقاطع الفيديو للشركات التي ليس لديها أي صور ومقاطع فيديو حتى الآن، أو التي لا ترغب في استخدام ما لديها. يقول باركر: "هذا هو الدافع وراء إنتاج فيلم الجليد. وهو إنشاء عالم وأجواء".
يتمتّع فيلم الجليد بجوّه الخاص بلا شك. ولكن جودته ليست عالية أيضاً. يقول روبن: "هذا المجال ليس مثالياً من أي ناحية حتى الآن. واجهنا صعوبات في توليد بعض الأمور باستخدام دال-إي، مثل الاستجابات العاطفية في الوجوه. ولكنه أدّى وظيفته على نحوٍ مثيرٍ للإعجاب في أحيان أخرى. وقلنا أكثر من مرة إننا نشهد سحراً أمامنا"،
ستتحسن كفاءة العملية التجريبية مع تقدّم التكنولوجيا أكثر. أُصدر نموذج دال-إي 2 الذي استخدمته شركة واي مارك لإنتاج فيلم الجليد قبل سنة واحدة فقط، وأُصدرت أدوات توليد مقاطع الفيديو التي تنشئ مقاطع قصيرة منذ بضعة أشهر فقط.
اقرأ أيضاً: تعرف على الفنان الأشهر في توليد الأعمال الفنية باستخدام الذكاء الاصطناعي
الجانب الأكثر ثورية في هذه التكنولوجيا
وفقاً لروبن، الجانب الأكثر ثورية في التكنولوجيا هو القدرة على توليد لقطات جديدة عند الطلب؛ إذ يقول: "يمكننا أن نحصل على اللقطة المرغوبة التي تتناسب تماماً مع سلسلة اللقطات بعد 15 دقيقة من إجراء عملية التجربة والخطأ". يتذكر روبن عملية تقطيع الفيلم وأنه احتاج إلى لقطات معينة، مثل لقطة مقرّبة لحذاء على سفح جبل. وكان قادراً على طلب هذه الصورة من نموذج دال-إي مباشرة. يقول روبن: "إنه أمر مذهل. وهنا أصبحت هذه التجربة منيرة بالنسبة لي بصفتي صانع أفلام".
يتذكر المؤسس الشريك لشركة برايفت آيلاند (Private Island)، وهي شركة ناشئة مقرها مدينة لندن تنتج مقاطع فيديو قصيرة، كريس بويل، انطباعاته الأولى عن نماذج صناعة الصور عندما رآها في عام 2022 قائلاً: "شعرت بالدوار للحظة عندما أدركت أن هذه التكنولوجيا ستغيّر كل شيء".
صمم بويل وفريقه إعلانات تجارية لمجموعة من العلامات التجارية العالمية، مثل بَد لايت (Bud Light) ونايكي وأوبر وتيريز تشوكلِت (Terry’s Chocolate)، بالإضافة إلى مقاطع فيديو قصيرة في ألعاب شهيرة للغاية مثل كول أوف ديوتي (Call of Duty).
استخدمت شركة برايفت آيلاند أدوات الذكاء الاصطناعي في مرحلة ما بعد الإنتاج لسنوات قليلة، لكنها زادت من استخدامها لهذه الأدوات خلال فترة جائحة كوفيد-19. يقول بويل: "كنا مشغولين للغاية خلال فترة الحجر الصحي، ولكننا لم نتمكن من التصوير كما كنا نفعل من قبل، لذلك بدأنا باستخدام التعلم الآلي بمعدل أكبر في ذلك الوقت".
اعتمدت الشركة مجموعة من التكنولوجيات التي تجعل عملية ما بعد الإنتاج وإضافة المؤثرات البصرية أسهل، مثل إنشاء مشاهد ثلاثية الأبعاد من صور ثنائية الأبعاد باستخدام حقول الإشعاع العصبي واستخدام التعلم الآلي لاستخلاص بيانات التقاط الحركة من اللقطات المصورة مسبقاً بدلاً من جمعها من البداية.
اقرأ أيضاً: نظام ذكاء اصطناعي جديد من ميتا يستطيع تحويل التعليمات النصية إلى مقاطع فيديو
لكن تكنولوجيا الذكاء الاصطناعي التوليدي هي التكنولوجيا الرائدة. نشرت شركة برايفت آيلاند في شهر أبريل/ نيسان 2023 إعلاناً تجارياً ساخراً على حسابها على موقع إنستغرام أنتجه الخبراء باستخدام نموذج جين-2 (Gen-2) من شركة رانواي المتخصص بإنشاء مقاطع الفيديو ونموذج ستيبل ديفيوجن (Stable Diffusion) لإنشاء الصور من شركة ستابيليتي أيه آي (Stability AI). أصبح هذا الإعلان رائجاً للغاية ولكن بالتدريج. يُظهر هذا الإعلان الذي يحمل اسم الصيف الاصطناعي (Synthetic Summer) مشهداً نموذجياً لإحدى حفلات الفناء الخلفي حيث يستلقي الشباب السعداء ويحتسون مشروباتهم تحت أشعة الشمس. مع ذلك، يمتلك الكثير من هؤلاء فجوات كبيرة في وجوههم بدلاً من أفواه، حيث تدخل علب المشروبات التي يحتسونها، كما أن الفناء الخلفي يحترق. إنه إعلان مرعب.
الصيف الاصطناعي/ شركة برايفت آيلاند
يقول بويل: "عندما تشاهده في البداية، ستظن أنه إعلان أميركي معتدل وعادي. لكن سيخبرك عقلك الباطن بأن وجوه الأشخاص في الإعلان مفتولة.
نحب فكرة استخدام الوسط نفسه لرواية القصة، وأعتقد أن هذا الإعلان هو مثال رائع لأن الوسط نفسه مخيف للغاية؛ إذ إنه يصوّر بعض مخاوف البشر حيال الذكاء الاصطناعي نوعاً ما".
اقرأ أيضاً: كيف تستخدم إنفيديا الذكاء الاصطناعي لتحسين جودة مكالمات الفيديو؟
الاستفادة من نقاط القوّة
هل هذه بداية حقبة جديدة من صناعة الأفلام؟ تتمتّع الأدوات الجديدة بمجال تطبيق ضيق. استفاد منتجو كلٍّ من فيلم الجليد وإعلان الصيف الاصطناعي من نقاط قوة التكنولوجيا التي استخدموها لإنتاج هذه الأعمال. يتناسب فيلم الجليد مع الجمالية المخيفة لنموذج دال-إي. يحتوي إعلان الصيف الاصطناعي على العديد من اللقطات السريعة، وذلك لأن أدوات توليد مقاطع الفيديو مثل جين-2 لا تنتج سوى المقاطع التي تبلغ مدتها بضع ثوانٍ، والتي يجب تجميعها معاً بعد ذلك. يقول بويل إن هذه الطريقة تنجح في إنتاج مشاهد احتفالية تسودها الفوضى. أخذت شركة برايفت آيلاند في الاعتبار أيضاً إنتاج فيلم يحتوي على الفنون القتالية؛ إذ إن اللقطات السريعة تناسب هذا النمط.
قد يعني هذا أننا سنشهد استخدام مقاطع الفيديو المولَّدة في مقاطع الفيديو الموسيقية والإعلانات التجارية. ولكن ليس من الواضح ما الاستخدامات المحتملة خارج هذا المجال. تقول مهداوي إنه لا يوجد الكثير من الأشخاص الذين يستخدمون مقاطع الفيديو المولّدة، بخلاف بعض الفنانين التجريبيين وعدد قليل من العلامات التجارية.
حالة عدم اليقين المستمرة هي أيضاً عامل منفّر بالنسبة للعملاء المحتملين. تقول مهداوي: "تحدّثتُ مع العديد من الشركات التي تبدو مهتمة ولكنها ترفض استهلاك الموارد في المشاريع لأن هذه التكنولوجيا تتغير بسرعة كبيرة". يقول بويل إن العديد من الشركات يخشى أيضاً من الدعاوى القضائية الجارية حول إدخال الصور المحمية بحقوق النشر في مجموعات البيانات التي استُخدمت لتدريب النماذج مثل ستيبل ديفيوجن.
وفقاً لمهدواي، لا يعلم أحد كيف سيتطوّر هذا المجال؛ إذ تقول: "هناك الكثير من الافتراضات المختلفة المطروحة حالياً، وهي لا تعتمد على اعتبارات دقيقة".
في الوقت نفسه، يواصل صانعو الأفلام تجربة الأدوات الجديدة. تستخدم مهداوي بعد الاستلهام من عمل صديقها، جيك أولسون، أدوات الذكاء الاصطناعي التوليدي لإنتاج فيلم وثائقي قصير للمساعدة على إزالة وصمة العار المرتبطة باضطراب استخدام الأفيون.
اقرأ أيضاً: ابتكار أداة جديدة يمكنها كشف التزييف العميق في الفيديوهات المضللة للمشاهير
وتخطط شركة واي مارك لإنتاج جزء ثانٍ من فيلم الجليد، على الرغم من أنها ليست مقتنعة تماماً باستخدام نموذج دال-إي 2. يقول بيرسكي-ستيرن: "أعتقد أن الفيلم سيكون استعراضياً أكثر. سنستخدم تكنولوجيا جديدة عند إنتاج الفيلم المقبل على الأرجح، وسنرى ما يمكن أن تنجزه هذه التكنولوجيا".
تجرّب شركة برايفت آيلاند إنتاج أفلام أخرى أيضاً؛ إذ إنها أنتجت مقطع فيديو في أوائل عام 2023 باستخدام نص ولّده نموذج تشات جي بي تي (ChatGPT)، وصورٍ ولّدها نموذج ستيبل ديفيوجن. تعمل الشركة حالياً على إنتاج فيلم هجين يشمل ممثلين حقيقيين يرتدون الملابس التي صممها نموذج ستيبل ديفيوجن.
يقول بويل: "نحن مهتمون بالجمالية للغاية"، ويضيف قائلاً إن ما ينتجه فريقه مختلف عن الصور السائدة في الثقافة الرقمية، التي اختُصرت إلى الرموز التعبيرية وتأثير الخطأ. من المُثير للحماس للغاية أن نشهد مصدر الجماليات الجديدة. الذكاء الاصطناعي التوليدي هو بمثابة صورة مشوَّهة عن البشر".