Open-Sora Plan v1.2 มาแล้ว! การอัปเดตนี้นำเสนอการอัพเกรดแบบปฏิวัติวงการ ซึ่งแกนหลักอยู่ที่สถาปัตยกรรม 3D เต็มรูปแบบ ซึ่งเปลี่ยนวิธีที่ AI เข้าใจโลกทางกายภาพและก้าวกระโดดจากระนาบไปสู่สามมิติ นอกเหนือจากการปรับปรุงความสามารถในการทำความเข้าใจโลกทางกายภาพแล้ว ความสามารถในการสร้างวิดีโอจากข้อความยังได้รับการปรับปรุงอย่างมีนัยสำคัญอีกด้วย ความชัดเจนและความสม่ำเสมอของวิดีโอที่สร้างขึ้นได้รับการปรับปรุงเช่นกัน ความสามารถในการประมวลผลของมิติพื้นที่และเวลา ได้รับการปรับให้เหมาะสมอย่างมาก และความเร็วในการอนุมานก็สูงขึ้นอย่างมาก เรามาดูการอัปเดตโดยละเอียดของ Open-Sora Plan v1.2 กัน
Open-Sora Plan ได้รับการอัปเกรดอีกครั้ง! เวอร์ชันล่าสุดของ Open-Sora Plan v1.2 นำเสนอสถาปัตยกรรม 3D เต็มรูปแบบแบบใหม่ ซึ่งช่วยเพิ่มความเข้าใจในโลกทางกายภาพ
ไฮไลท์หลักของการอัปเดตนี้:
สถาปัตยกรรม 3D เต็มรูปแบบแบบใหม่: สถาปัตยกรรมใหม่ช่วยให้ AI สามารถก้าวกระโดดเชิงคุณภาพในการทำความเข้าใจโลกทางกายภาพ ไม่ใช่โค้ด QR ที่สามารถคิดได้เพียงสองมิติอีกต่อไป แต่ตอนนี้สามารถเข้าใจโลกสามมิตินี้ได้แบบ 360 องศาโดยไม่มีจุดบอด!
ความสามารถด้านวิดีโอการสร้างข้อความที่อัปเกรดแล้ว: คุณพิมพ์ข้อความ จากนั้น AI จะสามารถนำเสนอภาพวิดีโอที่เหมือนจริงให้กับคุณได้
ปรับปรุงความชัดเจนและความสม่ำเสมอ: ด้วยสถาปัตยกรรมใหม่และโครงสร้าง VAE ที่ปรับให้เหมาะสม คุณภาพวิดีโอที่สร้างโดย Open-Sora มีความชัดเจนยิ่งขึ้น และเนื้อหามีความสอดคล้องกันมากขึ้น บอกลาความคลุมเครือ!
การผสานรวมพื้นที่และเวลาอย่างลงตัว: สถาปัตยกรรม 3D เต็มรูปแบบแบบใหม่ช่วยแก้ปัญหาสำคัญในเวอร์ชันก่อนหน้า นั่นคือการประมวลผลมิติพื้นที่และเวลาไปพร้อมๆ กัน สิ่งนี้หมายความว่าอย่างไร หมายความว่าวิดีโอที่สร้างขึ้นจะได้รับการปรับปรุงอย่างมีนัยสำคัญในแง่ของประสิทธิภาพเชิงพื้นที่และความคล่องแคล่วชั่วคราว!
ความเร็วในการอนุมานได้รับการปรับปรุงอย่างมาก: โครงสร้าง CausalVideoVAE ที่ได้รับการปรับปรุงไม่เพียงแต่ปรับปรุงประสิทธิภาพของโมเดลเท่านั้น แต่ยังทำให้ความเร็วในการอนุมานเพิ่มสูงขึ้นอีกด้วย ฝ่ายประสิทธิภาพเชียร์!
เมื่อมองย้อนกลับไปถึงประวัติการพัฒนาของ Open-Sora เราจะพบว่าความก้าวหน้าของมันนั้นน่าทึ่งมาก ล่าสุดในเดือนพฤษภาคม 2024 เวอร์ชัน v1.1.0 ยังคงใช้สถาปัตยกรรมโมเดล 2+1D ซึ่งส่วนใหญ่ใช้สำหรับการฝึกอบรมเชิงสำรวจ และตอนนี้ เพียงไม่กี่เดือนต่อมา มันก็ได้พัฒนาไปสู่ผู้สร้างที่สามารถสร้างโลก 3 มิติได้!
สิ่งที่ยอดเยี่ยมที่สุดคือทีม Open-Sora ไม่ได้ซ่อนอะไรเลย โค้ด ข้อมูล และโมเดลล้วนเป็นโอเพ่นซอร์ส และพวกเขาแค่ติดคำแนะนำเกี่ยวกับวิธีสร้างโลกไว้บนใบหน้าของคุณ เป้าหมายของพวกเขานั้นง่ายมาก: ให้ทุกคนกลายเป็นเทพเจ้าแห่งการสร้างสรรค์วิดีโอ! ทัศนคติที่เปิดกว้างและแบ่งปันนี้จะช่วยเร่งความก้าวหน้าของเทคโนโลยีการสร้างวิดีโอ AI อย่างไม่ต้องสงสัย
การเปิดตัว Open-Sora Plan v1.2.0 ถือเป็นยุคใหม่สำหรับโมเดลการสร้างวิดีโอ ไม่เพียงแต่ปรับปรุงการบีบอัดการแสดงภาพและประสิทธิภาพการใช้เหตุผลอย่างมีนัยสำคัญ แต่ยังชี้ให้เห็นทิศทางสำหรับการพัฒนาในอนาคตอีกด้วย
ที่อยู่โครงการ: https://top.aibase.com/tool/open-sora-plan-v1-2
การเปิดตัว Open-Sora Plan v1.2 เป็นการประกาศว่าเทคโนโลยีการสร้างวิดีโอ AI ได้เข้าสู่ขั้นตอนใหม่ของการพัฒนา และฟีเจอร์โอเพ่นซอร์สของมันยังให้แรงผลักดันที่แข็งแกร่งสำหรับความก้าวหน้าทางเทคโนโลยี เราหวังว่าจะมีสิ่งประหลาดใจอีกมากมายที่ Open-Sora สามารถนำมาได้ในอนาคต!