อาลีบาบาเปิดตัวโมเดลวิดีโอการสร้างภาพ I2VGen-XL ในเดือนพฤศจิกายน และในที่สุดโค้ดและโมเดลของมันก็กลายเป็นโอเพ่นซอร์สอย่างเป็นทางการ แบบจำลองใช้วิธีการประมวลผลสองขั้นตอน ขั้นตอนแรกช่วยให้มั่นใจได้ถึงความสอดคล้องกันทางความหมาย และขั้นตอนที่สองปรับปรุงรายละเอียดและความละเอียดของวิดีโอโดยการรวมข้อความสั้นเข้าด้วยกัน ด้วยการฝึกอบรมข้อมูลจำนวนมาก I2VGen-XL ได้แสดงให้เห็นถึงความแม่นยำด้านความหมายที่สูงขึ้น ความต่อเนื่องของรายละเอียด และความชัดเจนในด้านการสร้างวิดีโอ นำความก้าวหน้าครั้งใหม่ในด้านภาพมาสู่การสร้างวิดีโอ
อาลีบาบาได้ประกาศโมเดลวิดีโอการสร้างภาพโอเพ่นซอร์ส I2VGen-XL ในบทความที่ตีพิมพ์ในเดือนพฤศจิกายน และในที่สุดก็ได้เปิดตัวโค้ดและรุ่นเฉพาะแล้ว แบบจำลองได้รับการประมวลผลผ่านสองขั้นตอน ขั้นแรกเป็นขั้นตอนพื้นฐานเพื่อให้แน่ใจว่ามีความสอดคล้องกันทางความหมาย จากนั้นเป็นขั้นตอนการเพิ่มประสิทธิภาพเพื่อปรับปรุงรายละเอียดวิดีโอและปรับปรุงความละเอียดโดยการรวมข้อความสั้นเข้าด้วยกัน ทีมวิจัยได้รวบรวมข้อมูลจำนวนมากเพื่อการเพิ่มประสิทธิภาพ เพื่อให้โมเดล I2VGen-XL มีความแม่นยำด้านความหมายที่สูงขึ้น ความต่อเนื่องของรายละเอียด และความชัดเจนในการสร้างวิดีโอ รหัสโดยละเอียดสามารถพบได้บน GitHubโอเพ่นซอร์สของโมเดล I2VGen-XL มอบทรัพยากรอันมีค่าสำหรับนักวิจัยและนักพัฒนา และช่วยส่งเสริมการพัฒนาเทคโนโลยีวิดีโอการสร้างภาพเพิ่มเติม ขั้นตอนการประมวลผลที่มีประสิทธิภาพและเอฟเฟกต์การสร้างที่ยอดเยี่ยมบ่งบอกถึงศักยภาพมหาศาลของเทคโนโลยีวิดีโอที่สร้างโดย AI ในอนาคต หวังว่าจะมีแอปพลิเคชันที่เป็นนวัตกรรมใหม่เพิ่มเติมซึ่งใช้ I2VGen-XL