สถาบันวิจัยคอมพิวเตอร์อัจฉริยะของอาลีบาบาเสนอ EMO กรอบการซิงโครไนซ์เสียงและวิดีโอ

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-05 04:16:01

เมื่อเร็วๆ นี้ สถาบันวิจัยคอมพิวเตอร์อัจฉริยะของอาลีบาบาได้เปิดตัว EMO เฟรมเวิร์กวิดีโอเจนเนอเรชั่นใหม่ ซึ่งมีความสามารถที่น่าประทับใจ โดยเพียงแค่ป้อนภาพและเสียงเพื่อสร้างเนื้อหาวิดีโอที่สื่อความหมายได้สูง EMO รองรับหลายภาษา บทสนทนา การร้องเพลง และสถานการณ์อื่นๆ นำความเป็นไปได้ใหม่ๆ มาสู่วงการการสร้างวิดีโออวาตาร์ อย่างไรก็ตาม การพัฒนาเทคโนโลยียังนำมาซึ่งความเสี่ยงที่อาจเกิดขึ้น เช่น การปลอมแปลงอย่างล้ำลึกและปัญหาอื่น ๆ ที่ต้องให้ความสนใจ

สถาบันวิจัยคอมพิวเตอร์อัจฉริยะของอาลีบาบาได้เปิดตัว EMO กรอบการทำงานใหม่ ซึ่งสามารถสร้างวิดีโอที่สื่อความหมายได้โดยการป้อนภาพและเสียง EMO รองรับหลายภาษา บทสนทนา การร้องเพลง และสถานการณ์อื่นๆ แต่ก็มีความเสี่ยงของการฉ้อโกงเช่นกัน กรอบการทำงานนี้นำเสนอความเป็นไปได้ใหม่ๆ ในด้านการสร้างวิดีโออวตาร แต่ปัจจุบันใช้เพื่อการวิจัยทางวิชาการและการสาธิตเอฟเฟกต์เท่านั้น และยังคงต้องการการปรับปรุงและขยายเพิ่มเติม

การเกิดขึ้นของกรอบงาน EMO ถือเป็นการประกาศถึงระดับใหม่ของเทคโนโลยีการสร้างวิดีโอ AI และศักยภาพการใช้งานในหลายสถานการณ์นั้นมีมหาศาล แต่ในขณะเดียวกัน เรายังต้องใส่ใจกับความเสี่ยงด้านจริยธรรมและสังคมที่อาจเกิดขึ้น และเสริมสร้างการกำกับดูแลด้านเทคนิคเพื่อให้แน่ใจว่ามีการพัฒนาที่ดีและหลีกเลี่ยงการละเมิด