เฟรมเวิร์กการสร้างวิดีโอแนวตั้ง EMO ที่เปิดตัวโดยทีมงานอาลีบาบา ถือเป็นความก้าวหน้าครั้งสำคัญในด้านการสร้างเนื้อหาดิจิทัล สามารถสร้างวิดีโอที่สมจริงซึ่งประกอบด้วยการแสดงออกทางสีหน้าและการเคลื่อนไหวศีรษะที่หลากหลายโดยอิงจากภาพและเสียงอ้างอิง ซึ่งในทางเทคนิคแล้วสามารถผสมผสานเสียง รูปภาพ และการเคลื่อนไหวได้อย่างสมบูรณ์แบบ EMO ใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้าและเทคโนโลยีการประมวลผลสัญญาณรบกวนแบบหลายเฟรมเพื่อปรับปรุงความหมายและความสมจริงของวิดีโอที่สร้างขึ้นอย่างมีนัยสำคัญ ซึ่งเหนือกว่าเทคโนโลยีที่คล้ายกันที่มีอยู่ ความก้าวหน้าทางเทคโนโลยีนี้จะมีผลกระทบอย่างมากต่ออุตสาหกรรมสื่อดิจิทัลและเนื้อหาเสมือนจริง
ทีมงานอาลีบาบาได้เปิดตัวเฟรมเวิร์กการสร้างวิดีโอแนวตั้ง EMO ซึ่งสามารถสร้างวิดีโอแนวตั้งด้วยเสียงที่มีการแสดงออกทางสีหน้าและท่าทางศีรษะที่หลากหลาย EMO ใช้เครือข่ายอ้างอิงเพื่อแยกคุณสมบัติจากภาพอ้างอิงและเฟรมการดำเนินการ ประมวลผลและฝังเสียงผ่านตัวเข้ารหัสเสียงที่ได้รับการฝึกอบรมล่วงหน้า และรวมสัญญาณรบกวนแบบหลายเฟรมและมาสก์บริเวณใบหน้าเพื่อสร้างวิดีโอ ผลการทดลองแสดงให้เห็นว่า EMO มีประสิทธิภาพเหนือกว่าวิธีการที่มีอยู่ในแง่ของความหมายและความสมจริง ทิศทางการใช้งานที่เป็นไปได้ของโมเดลนี้จะปรับปรุงระดับทางเทคนิคของสื่อดิจิทัลและการสร้างเนื้อหาเสมือน แต่ก็อาจใช้เป็นเครื่องมือทางอาญาได้เช่นกันการเกิดขึ้นของกรอบการทำงาน EMO จะผลักดันการสร้างเนื้อหาดิจิทัลไปสู่ระดับใหม่อย่างไม่ต้องสงสัย แต่ก็จำเป็นต้องตื่นตัวต่อความเสี่ยงที่อาจเกิดขึ้นจากการละเมิดด้วย บรรทัดฐานทางจริยธรรมที่เกี่ยวข้องและมาตรการกำกับดูแลเป็นสิ่งจำเป็นเพื่อเป็นแนวทางในการพัฒนาที่ดีและรับประกันความปลอดภัยและความน่าเชื่อถือ ของการใช้งาน ความก้าวหน้าทางเทคโนโลยีควรคำนึงถึงผู้คนเป็นหลักและมีส่วนสนับสนุนการพัฒนาสังคมในเชิงบวก