نموذج جديد يعتمد على الذكاء الاصطناعي التوليدي قد يُحدث نقلة نوعية في إنتاج مقاطع الفيديو

أطلقت شركة رنواي (Runway)؛ وهي شركة ناشئة تعمل على تطوير نماذج الذكاء الاصطناعي التوليدي وشاركت في إنشاء نموذج تحويل النصوص إلى الصور الذي يحمل اسم ستيبل ديفيوجن (Stable Diffusion) في عام 2022، نموذجاً جديداً يعتمد على الذكاء الاصطناعي يحمل اسم جين-1 (Gen-1) يمكن استخدامه لتحويل مقاطع الفيديو المصورة مسبقاً إلى مقاطع جديدة من خلال تطبيق أي نمط محدد بواسطة أمر نصيّ أو صورة مرجعية.

النموذج الجديد جين-1

بينت شركة رنواي في مقطع فيديو تجريبي قصير نُشر على موقعها على الإنترنت كيف يمكن للنموذج الجديد تحويل الناس في الشارع إلى دمى فن تحريك الصلصال، والكتب المكدّسة على طاولة إلى مشهد ليلي في مدينة. تأمل الشركة أن يُحدث النموذج الجديد نقلة كبيرة في عملية إنتاج مقاطع الفيديو كما فعل نموذج ستيبل ديفيوجن في مجال تصميم الصور. ويقول الرئيس التنفيذي والشريك المؤسس لشركة رنواي، كريستوبال فالينزويلا (Cristóbal Valenzuela): "لقد شهدنا انتشاراً واسعاً لنماذج توليد الصور"، ويضيف: "أعتقد حقاً أن عام 2023 سيكون عام التطورات في مجال إنتاج مقاطع الفيديو".

تم تأسيس شركة رنواي في عام 2018، وطور خبراؤها برمجيات تعديل مقاطع الفيديو المدعومة بالذكاء الاصطناعي لعدة سنوات. يتم استخدام الأدوات التي تطورها هذه الشركة من قبل مستخدمي موقعي تيك توك (TikTok) ويوتيوب (YouTube) بالإضافة إلى استوديوهات تصوير الأفلام والمسلسلات الشهيرة، وقد استخدم منتجو برنامج ذا ليت شو وذ ستيفن كولبير (The Late Show with Steven Colbert) نموذج جين-1 لتعديل رسوميات البرنامج كما استخدم فريق المؤثرات المرئية الذي عمل في الفيلم الناجح الذي يحمل اسم "كل شيء في كل مكان في اللحظة نفسها" (Everything Everywhere All at Once) التكنولوجيات التي تطورها شركة رنواي لإنشاء مشاهد معينة.

ستيبل ديفيوجن

في عام 2021، تعاونت هذه الشركة مع مجموعة من الباحثين في جامعة ميونخ لتصميم النسخة الأولى من نموذج ستيبل ديفيوجن، ثم قامت الشركة الناشئة ستابيليتي أيه آي (Stability AI) التي تتخذ من المملكة المتحدة مقراً لها، بدفع تكاليف الحوسبة الضرورية لتدريب النموذج باستخدام كمية أكبر من البيانات. في عام 2022، روجت شركة ستابيليتي أيه آي نموذج ستيبل ديفيوجن على نطاق واسع، محولة النموذج من مشروع بحثيّ إلى ظاهرة عالمية.

لكن توقفت الشركتان عن التعاون حالياً مع اتخاذ شركة غيتي (Getty) إجراءات قانونية ضد شركة ستابيليتي أيه آي؛ إذ إنها ادّعت أن هذه الأخيرة استخدمت صور شركة غيتي التي تظهر في بيانات تدريب نموذج ستيبل ديفيوجن دون إذن، وتحرص شركة رنواي على عدم التدخل في هذا النموذج.

شركة رنواي

صفحة جديدة في محولات النصوص إلى فيديو

يمثّل نموذج جين-1 بداية صفحة جديدة بالنسبة إلى شركة رنواي؛ إذ إنه أُطلق بعد صدور عدد كبير من نماذج تحويل النصوص إلى مقاطع الفيديو في عام 2022؛ مثل نموذج ميك أ فيديو (Make-a-Video) الذي أطلقته شركة ميتا (Meta)، ونموذج فيناكي (Phenaki) الذي أطلقته شركة جوجل (Google).

يتمتع النموذجان كلاهما بالقدرة على توليد مقاطع الفيديو القصيرة للغاية من الصفر. يُعتبر نموذج جين-1 مشابهاً أيضاً لنموذج دريميكس (Dreamix)، وهو نموذج معتمد على الذكاء الاصطناعي التوليدي أصدرته شركة جوجل مؤخراً ويمكنه إنشاء مقاطع فيديو جديدة من مقاطع فيديو مصورة مسبقاً من خلال تطبيق أنماط محددة. ولكن وفقاً لمقطع الفيديو التجريبي الذي أطلقته شركة رنواي؛ يبدو أن نموذج جين-1 قادر على إنشاء مقاطع فيديو أكثر جودة. ونظراً لأن هذا النموذج يحول مقاطع الفيديو المصورة مسبقاً، فهو قادر أيضاً على إنتاج مقاطع فيديو أطول بكثير من معظم النماذج السابقة (صرحت شركة رنواي أنها ستنشر التفاصيل التقنية المتعلقة بهذا النموذج على موقعها في الأيام القليلة المقبلة).

نماذج الذكاء الاصطناعي التوليدي

على عكس شركتيّ ميتا وجوجل، صممت شركة رنواي نموذجها الجديد مع أخذ حاجات المستهلكين بعين الاعتبار. ويقول فالينزويلا: "يُعتبر هذا النموذج أحد أول النماذج التي تم تطويرها بالتعاون الوثيق مع مجموعة من منتجي مقاطع الفيديو"، ويضيف: "تم إصدار التطبيق بعد سنوات من التعلم عن الطرائق التي يعمل وفقها منتجو الأفلام ومعدّلو المؤثرات البصرية في مرحلة ما بعد الإنتاج".

ويُعتبر نموذج جين-1 الذي يعمل على السحابة عبر موقع شركة رنواي، متوفراً حالياً لمجموعة ضيقة من المستخدمين الذين تمت دعوتهم لاستخدامه، وسيتم إطلاقه للمستخدمين في قوائم الانتظار في الأسابيع القليلة المقبلة.

تم دفع الانتشار الواسع لنماذج الذكاء الاصطناعي التوليدي في عام 2022 من قبل ملايين الأشخاص الذين تمكّنوا من استخدام الأدوات الإبداعية عالية الكفاءة لأول مرة وشاركوا ما صمموه باستخدامها مع العوام. من خلال وضع نموذج جين-1 في أيدي المحترفين المبدعين؛ يأمل فالينزويلا أن نشهد قريباً تأثيراً مشابهاً للذكاء الاصطناعي التوليدي في مجال إنتاج مقاطع الفيديو.

ويقول فالينزويلا: "اقتربنا للغاية من توليد أفلام روائية كاملة باستخدام هذا النموذج"، ويضيف: "اقتربنا من مرحلة سيكون فيها معظم المحتوى على الإنترنت مولّداً باستخدام الذكاء الاصطناعي".