على الرغم من الضجة التي أحدثتها نماذج توليد الفيديو المدعومة بالذكاء الاصطناعي، فإنها جميعها لم تتمكن من توليد مقاطع فيديو تزيد مدتها على 6 ثوانٍ، لذلك فإن أي تقدم على مستوى الثواني التي يمكن لهذه النماذج توليدها يستحق الذكر، وهذا ما تميز به الإصدار الجديد من فيو 2 (Veo 2).
طرحت جوجل ديب مايند أداة توليد الفيديو فيو 2 (Veo 2) في منتصف عام 2024، وقد لاقت الأداة استحسان المستخدمين، وحدّثت جوجل الأداة في شهر مارس من العام الحالي، بطريقة أحدثت نقلة نوعية في طريقة توليد مقاطع الفيديو بالذكاء الاصطناعي.
ما هو فيو 2 (Veo 2)؟
هو نموذج مطور لتوليد الفيديو ابتداءً من الأوامر النصية والصور الثابتة، وينتج صوراً سينمائية عالية الجودة. يفهم فيو 2 الأوامر المدخلة إليه بدقة، ولا يفسّرها بطريقة مفككة أو مبهمة، ما يمكّن المستخدم من الحصول على نتائج تمثّل ترجمة حقيقية للأوامر التي أدخلها. ويمكن التحكم بزاوية التصوير ونوع اللقطات المصورة والحركات والتراكيب.
يمكن أن ينتج فيو 2 مقاطع فيديو ابتداءً من صور كرتونية أو مشاهد أنمي، لكنه يتميز بالمشاهد السينمائية أكثر من غيرها. دقة مقاطع الفيديو التي يولّدها 4K، على الرغم من أن المخرجات الحالية هي بدقة 720p. النموذج متاح على منصتي فيرتيكس أيه آي (Vertex AI) وفيديو إف إكس (VideoFX وعلى أداة ويسك (Whisk) التي ما زالت تجريبية.
اقرأ أيضاً: تعرف إلى أدوات توليد الصور الواقعية ومقاطع الفيديو باستخدام فايرفلاي من أدوبي
ما هي خصائص وميزات فيو 2؟
يتمتّع فيو 2 بالخصائص التالية:
- الطريقة التي يعمل بها: توليد فيديو من نص أو من صورة.
- عدد الأوامر التي يمكن تلقينها للنموذج: تصل إلى 10 أوامر في الدقيقة.
- مدة الاستجابة: عادة ما يولّد النموذج مقاطع الفيديو في غضون دقيقة -وصلت أحياناً إلى 30 ثانية- لكن يزداد زمن الاستجابة في أوقات الذروة والضغط على استخدامه.
- عدد مقاطع الفيديو التي يمكن توليدها في المطالبة الواحدة: 4 بالحد الأقصى.
- الطول الأقصى للفيديو: 8 ثوانٍ.
- دقة الفيديو الناتجة: 750p، ومن المتوقع أن تصبح 4K قريباً.
- معدل الإطارات: 24 إطاراً في الثانية.
- نسبة العرض إلى الارتفاع: متوفرة 16:9 أفقياً، و9:16 عمودياً.
- الحجم الأقصى للصور التي يمكن تحميلها في المطالبة عند توليد الفيديو من الصور: 20 ميغابايت.
ميزات فيو 2:
- مقاطع فيديو واقعية: ينتج مقاطع فيديو مفصّلة دون الأخطاء التي كانت تظهر في الإصدارات السابقة.
- أوامر مضبوطة: يمكن للمستخدمين تحديد نوع العدسات وزوايا الكاميرات أو المؤثرات الخاصة للحصول على مخرجات محددة.
- دقة عالية: يمكن للنموذج إنشاء مقاطع فيديو بدقة 4k.
- حركة سلسلة: يفهم النموذج فيزياء العالم الحقيقي، ما يمكّنه من إنشاء حركة طبيعية ودقيقة في المقاطع الناتجة.
قد يطلب النموذج عبر رسالة خطأ إثبات عمر المستخدم في مطالبات محددة، يمكنك حينها اتباع الطريقة التي تثبت فيها هويتك في مثل هذه الحالات. تجري عملية المعالجة للحصول على مخرجات فيو 2 على نقاط نهاية إقليمية وعالمية تابعة لخدمات جوجل السحابية، وتُشفّر البيانات في أثناء النقل والتخزين، وهناك تحكم صارم بالوصول إلى البيانات على السحابة وليس على جهاز المستخدم.
النموذج غير متاح في العديد من البلدان حتى الآن.
اقرأ أيضاً: إليك كيف تستفيد من نموذج دال إي-3 لتوليد الصور
استخدام فيو 2 على جوجل أيه آي استوديو
في البداية، يجب الدخول إلى منصة جوجل أيه آي استوديو من الرابط.
1- اختر Video Gen من القائمة على اليسار، بعد الدخول إلى الواجهة. يُلاحظ أن قيم معدل الإطارات والدقة ثابتة حالياً لا يمكن تغييرها.
2- يمكنك إدخال المطالبة التي ترغب فيها في المستطيل. تلاحظ عند بدء الكتابة في المستطيل ظهور رسالة تطلب الوصول إلى جوجل درايف الخاص بك. أكد إمكانيه الوصول لتتمكن من المتابعة وإدخال المطالبة.
3- أدخلت المطالبة: Create a video of moving dog on the beach. let the style cartoonish
4- استغرقت عملية التوليد دقيقة ونصف، يمكن تصدير الفيديو إلى جوجل درايف أو تنزيله على وحدة التخزين المحلية على الكمبيوتر لديك.
أمّا الفيديو الناتج فتجده على الرابط
ملاحظة
- أدخلت المطالبة التالية: Create a video demonstrating Masha On the banks of a lake surrounded by forests, Masha is running with a flying red balloon. Point the camera towards the sun's rays at an angle of 60. Make the scene cartoonish, not cinematic.
- كانت النتيجة أن النموذج لم يتمكن من معالجة الطلب لدواعي الأمان، وقد تكررت الرسالة حتى في حالة تغيير اسم ماشا ووضع "فتاة صغيرة little girl" في المطالبة، وقد يكون ذلك بسبب قيود وضعتها جوجل.
- لا يمكن إجراء دردشة مع النموذج لإجراء تعديلات لاحقة على الفيديو.
أمّا بالنسبة للمطالبة من صورة:
1- تحميل الصورة إلى النموذج.
2- يمكن اختيار المكان الذي سترفع منه الصورة.
3- بعد اختيار الصورة، كما في المثال، أدخلت المطالبة:Create a video from this image that shows the bird spreading its wings and flying
4- انتهى النموذج من توليد الفيديو بعد دقيقة و14 ثانية
5- كانت النتيجة كما على الرابط
لم تكن النتيجة بجودة مخرجات تحويل النص إلى فيديو، وهو ما تعمل جوجل على تحسينه.
ملاحظة: في مربع الـ Negative prompte يمكنك التحكم عبر إدخال نص بما لا تريد ظهوره في الفيديو الناتج.
فيو 2 مقابل نماذج أخرى
على الرغم من أن الكثير من منتجات جوجل القائمة على الذكاء الاصطناعي التوليدي لم تكن متفوقة على نظيراتها، فنموذج فيو 2 مختلف؛ فمنذ انطلاقه أثبت أنه منافس قوي لغيره من نماذج توليد الفيديو الأخرى، مثل سورا توربو Sora Turbo من أوبن أيه آي، ورانوي جين-3 ألفا Runway Gen-3 Alpha، ولوما Luma وكلينغ Kling وعلي بابا كوين Alibaba Qwen وسينثيزيا Synthesia، وغيرها
فيو 2 | سورا توربو | رانوي جين-3 ألفا | نماذج أخرى | |
---|---|---|---|---|
الدقة العظمى | 4k | 1080p | 720p | لوما Luma (4k في النسخة المدفوعة فقط) |
طول الفيديو | 8 ثوانٍ | 5 ثوانٍ | 5 ثوانٍ | بيكا (Pika) 5 ثوانٍ في التجربة المجانية |
واقعية الفيديو | حركة فنية سينمائية | معتدلة | ما زالت بحاجة إلى التحسين | يتميز كلينغ Kling بجودة عالية |
التحكم بالكاميرا | متقدم (زوايا، حركات، أنماط) | محددة | عادية | علي بابا كوين (محدودة في النسخة المجانية) |
سرعة الاستجابة | جيدة | مميزة وإبداعية | معتدلة | تتميز سينثيزيا بالوجوه التي تولدها |
الوصول | عدد محدود مجاناً | وصول بالنسخة المدفوعة | وصول محدود إلى الميزات في التجربة المجانية | هايلو Hailuo (يمكن توليد فيديوهات قصيرة منه مجاناً) |
منذ تاريخ 15 أبريل الفائت، أصبح بإمكان مشتركي جيميناي أدفانسد الاستفادة من فيو 2 في توليد مقاطع الفيديو عبر مطالبة نصية ضمن جيميناي نفسه.