Editor Downcodes mengetahui bahwa tim teknis Zhipu baru-baru ini melakukan open source model generasi video terbaru CogVideoX v1.5, yang merupakan pembaruan besar lainnya dari seri CogVideoX sejak Agustus. Pembaruan ini menghadirkan peningkatan kinerja yang signifikan, memberi pengembang alat pembuatan video yang lebih canggih, dan menandai tahap baru dalam teknologi pembuatan video AI. CogVideoX v1.5 telah meningkatkan panjang video, resolusi, dan kecepatan bingkai secara signifikan, serta meningkatkan kemampuannya untuk memahami semantik yang kompleks, sehingga semakin memperluas skenario penerapannya.
Dapat dipahami bahwa pembaruan ini telah sangat meningkatkan kemampuan pembuatan video, termasuk mendukung video berdurasi 5 detik dan 10 detik, resolusi 768P, dan kemampuan pembuatan 16 bingkai. Pada saat yang sama, model I2V (gambar ke video) juga mendukung rasio ukuran apa pun, sehingga semakin meningkatkan kemampuan untuk memahami semantik yang kompleks.
CogVideoX v1.5 berisi dua model utama: CogVideoX v1.5-5B dan CogVideoX v1.5-5B-I2V, yang dirancang untuk memberi pengembang alat pembuatan video yang lebih canggih.
Yang lebih penting lagi adalah CogVideoX v1.5 akan diluncurkan secara bersamaan di platform Qingying dan digabungkan dengan model efek suara CogSound yang baru diluncurkan untuk menjadi "Qingying Baru" . Qingying baru akan memberikan sejumlah layanan khusus, termasuk peningkatan signifikan dalam kualitas video, kinerja estetika, dan rasionalitas gerakan, serta mendukung pembuatan video definisi ultra tinggi berdurasi 10 detik, 4K, 60 bingkai.
Pengenalan resminya adalah sebagai berikut:
Sumber terbuka CogVideoX v1.5 menghadirkan vitalitas baru di bidang pembuatan video AI dan memberikan lebih banyak kemungkinan kepada pengembang. Saya yakin di masa depan, kita akan melihat lebih banyak aplikasi inovatif berdasarkan CogVideoX v1.5. Editor Downcodes akan terus memperhatikan perkembangan terkini di bidang ini dan memberikan Anda laporan yang lebih menarik.