في عالم روايات هاري بوتر للكاتبة ج. ك. رولنيغ، تعتبر صور عالم السحرة مماثلة للصور العادية، باستثناء أن الشخصيات الماثلة فيها تتحرك؛ فهي تلوِّح بأيديها وتبتسم وتختفي تماماً في بعض الأحيان من الصورة لقضاء مصالحها.
الصور المسحورة هي صنيعة خيال رولينغ الخصب، لكن ربما يتوافر قريباً للبشر خارج عالمها المسحور شيء مشابه لها، وذلك بفضل بحوث تشونغ وي-وينغ في جامعة واشنطن بولاية سياتل، وجهود اثنين من أصدقائه. فقد ابتكر وي-وينغ وصديقاه برمجية تُسمى "فوتو ويك-آب" (Photo Wake-Up)، يمكنها تحريك الشخصية المركزية في الصورة دون المساس بعناصر الصورة الأخرى.
هذه العملية أصعب مما قد نتصور، وذلك بسبب مشكلة مهمة لا حل لها في علوم الحاسوب حتى الآن، وهي مشكلة تقدير مساحة الجسم. فنظراً لأن صورة الإنسان الفوتوغرافية ثنائية الأبعاد، يكون السؤال الذي تجاهد تقنية "رؤية الآلة" للإجابة عنه هو: كيف ستكون وضعية الشخص ثلاثية الأبعاد؟
الإجابة صعبة لأن الأجسام في الصور قد تكون محجوبة جزئياً وراء أجزاء من جسم الشخص نفسه مثلاً، كما يحدث عندما يعقد الشخص ذراعيه على صدره عند تصويره. ويصعِّب هذا على الآلة تحديد البناء الثلاثي الأبعاد بِناء على صورة ثنائية الأبعاد.
ولقد حاولت فرق علوم حاسوب كثيرة التصدي لهذه المشكلة. وفي إطار جهود وينغ، استعان هو ورفيقاه ببرنامج يُدعى SMPL، طوَّره فريق من مايكروسوفت وجمعية ماكس بلانك للنظم الذكية في ألمانيا.
وقد بدأت العملية باقتطاع جسم الشخص بصيغة ثنائية الأبعاد، وفرض هيكل ثلاثي الأبعاد على الشكل الخارجي لجسم الشخص ثنائي الأبعاد، وبعد ذلك كان من الممكن تحريك الهيكل لتهيئة الإحساس بالحركة. وقد حلَّ هذا مشكلة تقدير وضعية الجسم، لكن مع توافر مجموعة من الشروط.
فالبرمجية تحتاج لرؤية جسم كامل من الرأس إلى أخمص القدمين، ومن الأمام، ويمكنها التعامل مع بعض حالات حجب أجزاء من الجسم، مثل أن تكون الذراع أمام الجسم، لكن لا يمكنها التعامل مع حالات الحجب الأكثر تعقيداً، مثل أن تكون الصورة لشخص جالس القرفصاء. وبالتالي فإن رسم الجسم من صورة ثنائية الأبعاد بصيغة هيكل ثلاثي الأبعاد لا تُقدِّم تحريكاً واقعياً.
وهنا يأتي دور وينغ ورفيقيه؛ إذ يتلخص إنجازهم الأساسي في تطوير طريقة لمعالجة الجسم الثنائي الأبعاد المقتطع من الصورة بشكل يؤدي إلى تقديم نموذج واقعي ثلاثي الأبعاد للجسم. قال وينغ وفريقه: "إسهامنا التقني الأساسي هو تقديم طريقة لبناء نموذج متحرك ثلاثي الأبعاد يضاهي الإطار الخارجي لشكل الجسم في الصورة الثابتة".
وقد حاول علماء الحاسوب في الماضي حلَّ هذه المشكلة عن طريق إعادة تشكيل شبكة على هيئة جسم ثلاثي الأبعاد بحيث تعكس صورة الجسم ثنائي الأبعاد المقتطعة من الصورة، ولكن النتيجة لم تكن مُرضية تماماً، لذا حاول وينغ ورفيقاه إيجاد طريقة أخرى.
وتتلخص فكرتهم في عمل شبكة على هيئة الجسم بصيغة ثنائية الأبعاد، ثم تركيبها على صورة الجسم ثنائية الأبعاد باستخدام خوارزمية للربط بين الشبكة والصورة. هذه العملية تؤدي إلى التعرف على أجزاء معينة من الجسم على الشبكة التي تتخذ هيئة الجسم (الرأس، الذراع اليمنى، الساق اليمنى، الذراع اليسرى، الساق اليسرى، الجذع) والربط بين كل منها ومثيلتها من الصورة المقتطعة للجسم.
ومع تحقيق عملية التركيب ثنائية الأبعاد هذه، تقوم البرمجية بعد ذلك بإعادتها إلى صيغة ثلاثية الأبعاد، حيث يقول الفريق: "منهج الربط بين الشبكة وصورة الجسم هذه في مرحلة الأبعاد الثنائية ناجحة في التعامل مع الصور التي يتخذ الأشخاص فيها وضعيات معقدة".
ويولي الفريق اهتماماً خاصاً بالرأس، الذي يميل المُشاهد عموماً للتركيز عليه، حيث قالوا: "الدقة في وضع الرأس مهم لعمل صورة متحركة ناجحة"، من ثم فإن الخوارزمية التي ابتكروها تتعرف أيضاً على سمات من قبيل اتجاه نظرة الشخص وزاوية الرأس، ثم يتم استخدام هذه المعلومات في ضبط زاوية دقيقة لوضعية الرأس من حيث الارتكاز على الجسم.
هذه التقنيات التي تعمل بشكل أوتوماتيكي على مراحل متعاقبة هي تقنيات جيدة، لكنها ليست خالية من العيوب؛ لذا يقوم الفريق أيضاً بتطوير برمجية يسيرة الاستخدام يمكن لأي أحد الاستعانة بها في تغيير وضعية هيكل الجسم، بما يمكِّن المستخدمين من تصحيح أية أخطاء في عملية تحريك الصورة ومن تحسين الصورة المتحركة.
والنتيجة النهائية هي صورة متحركة مدهشة؛ حيث تقوم الخوارزمية بعزل الجسم البشري في الصورة، وتقتطعه من الصورة، وتملأ الفجوة التي كان يحتلها الجسم بخوارزمية لتعبئة الهيكل الخالي، وبعد هذا تقوم بتحريكه بصيغة ثلاثية الأبعاد بحيث يقوم الجسم المتحرك بالخروج من الصورة، أو بالركض، أو بالقفز، أو بالتلويح باليدين، كما في الصور السحرية التي قدمتها رولينغ في رواياتها. بل إن الخوارزمية تنجح أيضاً في سياق الواقع المُعزز.
وقال الفريق: "طريقتنا هذه ناجحة في التعامل مع وضعيات كثيرة للأجسام، وتُطبق بنجاح على الصور الأمامية، من صور عالم الرياضة إلى الفنون إلى الملصقات الدعائية التي بها أشخاص"، ولقد أنتج الفريق مقطعاً مرئياً لشرح طريقتهم ونتائجها، وهو يستحق المشاهدة.
إنه عمل مهم ويمكن استخدامه في الترفيه وفي التعليم. وكما قال وينغ ورفيقاه: "نرى أن هذه الطريقة في التحريك لن تُمكننا من إيجاد سبل جديدة لتمتع الناس بالصور ومن تفاعلهم معها فحسب، بل هي أيضاً تشير إلى طريقة لإعادة بناء آفاتار افتراضي من صورة واحدة. وهي في الوقت نفسه تشير إلى أحدث ما تم التوصل إليه فيما يخص عملية عمل نموذج بشري من صورة فوتوغرافية واحدة".
حتى رولينغ روائية عالم السحر ستنبهر من هذا الإنجاز!