يعد إطار عمل إنشاء فيديو بورتريه EMO الذي أطلقه فريق Alibaba بمثابة إنجاز كبير في مجال إنشاء المحتوى الرقمي. ويمكنه إنشاء مقاطع فيديو واقعية تحتوي على تعبيرات وجه غنية وحركات رأس بناءً على الصور المرجعية والصوت، مما يحقق من الناحية الفنية اندماجًا مثاليًا للصوت والصور والحركات. تستخدم EMO نماذج مدربة مسبقًا وتقنية معالجة الضوضاء متعددة الإطارات لتحسين تعبير وواقعية مقاطع الفيديو التي تم إنشاؤها بشكل كبير، متجاوزة التقنيات المماثلة الحالية. سيكون لهذا التقدم التكنولوجي تأثير عميق على الوسائط الرقمية وصناعات المحتوى الافتراضي.
أصدر فريق علي بابا إطار عمل إنشاء مقاطع الفيديو الشخصية EMO، وهو قادر على إنشاء مقاطع فيديو صوتية مع تعبيرات وجه غنية ووضعيات للرأس. يستخدم EMO شبكة مرجعية لاستخراج الميزات من الصور المرجعية وإطارات الحركة، ويقوم بمعالجة الأصوات وتضمينها من خلال برنامج تشفير صوتي مُدرب مسبقًا، ويجمع بين الضوضاء متعددة الإطارات وأقنعة منطقة الوجه لإنشاء مقاطع فيديو. تظهر النتائج التجريبية أن EMO يتفوق على الأساليب الحالية من حيث التعبير والواقعية. سيؤدي اتجاه التطبيق المحتمل لهذا النموذج إلى تحسين المستوى الفني للوسائط الرقمية وتوليد المحتوى الافتراضي، ولكن يمكن استخدامه أيضًا كأداة إجرامية.لا شك أن ظهور إطار عمل EMO سيدفع إنشاء المحتوى الرقمي إلى آفاق جديدة، ولكن من الضروري أيضًا الانتباه إلى المخاطر المحتملة لإساءة الاستخدام. هناك حاجة إلى معايير أخلاقية وتدابير تنظيمية ذات صلة لتوجيه تطوره الصحي وضمان السلامة والموثوقية من تطبيقاتها. وينبغي للتقدم التكنولوجي أن يكون دائما موجها نحو الناس وأن يقدم مساهمات إيجابية في التنمية الاجتماعية.