أصبحت المكالمات الفيديوية جزءاً من حياتنا اليومية؛ فقد شهد استخدام طريقة الاتصال هذه ارتفاعاً غير مسبوق كوسيلة للتواصل مع العائلة والأصدقاء ولعقد الاجتماعات الافتراضية بين أفراد الفرق العاملة عن بعد. وتعمل العديد من الشركات على تحسين جودة هذه الخدمة وتطويرها لتقديم أفضل تجربة مستخدم ممكنة.
وفي هذا السياق، أعلنت شركة إنفيديا يوم 5 أكتوبر عن إطلاق منصة ماكسين (Maxine)، وهي منصة ذكاء اصطناعي قائمة على السحابة يمكن للمطورين استخدامها لتحسين خدمات وتطبيقات مكالمات الفيديو. وتتضمن هذه المنصة العديد من الميزات، مثل الدقة الفائقة، والترجمة في الوقت الحقيقي، وتخفيض عرض النطاق الترددي اللازم للمكالمة الفيديوية، والتأطير التلقائي، وإزالة الضجيج الخلفي.
مميزات منصة ماكسين الجديدة من إنفيديا.
مصدر الفيديو: إنفيديا
وتقول الشركة إن تشغيل تطبيقات الاتصال الفيديوي المعتمدة على منصة ماكسين في السحابة يمكِّن من إتاحة جميع الميزات السابقة لأي مستخدم وعلى أي جهاز، سواء كان حاسوباً أو جهازاً لوحياً أو هاتفاً ذكياً. كما أن اعتماد المنصة على السحابة يجعل من السهل تطوير ونشر خدمات مصغرة قادرة على التوسع للتعامل مع مئات الآلاف من المكالمات الفيديوية.
الشبكات التوليدية التنافسية لإعادة تشكيل الوجه
تعتمد منصة ماكسين على الذكاء الاصطناعي لتحديد نقاط الوجه الرئيسية لكل شخص في مكالمة فيديو، ثم تطبِّق هذه النقاط على صورة ثابتة لإعادة تشكيل صورة حية لوجه الشخص على الجانب الآخر من المكالمة بالاعتماد على الشبكات التوليدية التنافسية (GANs).
يمكن استخدام هذه الميزة لضبط محاذاة الوجه؛ حيث يتم تدوير الوجوه بحيث يبدو أن الأشخاص يواجهون بعضهم البعض أثناء المكالمة. بالإضافة إلى تصحيح شكل العينين بحيث يبدو أن الشخص ينظر مباشرة إلى عيون الأشخاص الآخرين في المكالمة. كما يمكن للمطورين إضافة ميزات تسمح للمشاركين في المكالمة باختيار الصور الرمزية الخاصة بهم التي يتم تحريكها بشكل واقعي في الوقت الحقيقي مع الحفاظ على أصواتهم ونبرة حديثهم.
كما تساعد هذه الميزة على خفض النطاق الترددي اللازم لإجراء المكالمات الفيديوية؛ إذ تتيح الاستغناء عن إرسال كامل بكسلات الشاشة من خلال إعادة تشكيل الصورة الحية بالاعتماد على نقاط الوجه الرئيسية على جهاز الطرف الآخر من المكالمة؛ ما يمكِّن المطورين من خفض النطاق الترددي إلى عُشر النطاق اللازم وفق معيار H.264 لضغط الفيديو. وسيؤدي ذلك إلى خفض تكاليف مزودي خدمات الاتصال الفيديوي وتوفير تجربة أكثر سلاسة للمستخدمين.
تحسين تجربة المستخدم
تحتوي منصة ماكسين على ميزة الدقة الفائقة المستندة إلى الذكاء الاصطناعي، والتي تتولى تحويل الدقة المنخفضة إلى مقاطع فيديو عالية الدقة في الوقت الحقيقي، ما يساعد على خفض متطلبات النطاق الترددي لموفري خدمات المكالمات الفيديوية، فضلاً عن تحسين تجربة الاتصال للمستخدمين ذوي النطاق الترددي المنخفض. كما تتيح المنصة للمطورين إضافة ميزات لعزل الضجيج الخلفي، وتحسين الصورة ذات الإضاءة المنخفضة، وتأطير الكاميرا بحيث تركِّز تلقائياً على وجه المستخدم حتى لو تحرَّك من مكانه.
مكالمات فيديوية تستفيد من أحدث النماذج اللغوية
تستخدم ماكسين إنفيديا جارفيس (Nvidia Jarvis)، وهي منصة ذكاء اصطناعي مزودة بأحدث نماذج معالجة اللغات الطبيعية للتعرف على الكلام وتوليده وفهم اللغة. وتتيح هذه المنصة للمطورين دمج المساعدين الافتراضيين في المكالمة الفيديوية لأخذ الملاحظات والإجابة عن الأسئلة بصوت بشري. كما توفر الترجمة وتحويل الكلام إلى نص في الزمن الحقيقي.
وفي الختام، يُعرف عن شركة إنفيديا براعتها في مواكبة أحدث التوجهات الناشئة في مجال الذكاء الاصطناعي؛ فهي تصنع الشرائح الإلكترونية الأكثر شهرة واستخداماً في تدريب نماذج التعلم العميق، وتعمل على تطوير العديد من نماذج معالجة اللغات الطبيعية وأساليب توليد صور الوجوه. ويبدو أن الشركة استفادت من خبراتها الكبيرة في مجال الذكاء الاصطناعي في إطلاق منصة ماكسين.