Open-Sora Plan v1.2 telah hadir! Pembaruan ini menghadirkan peningkatan revolusioner, yang intinya terletak pada arsitektur perhatian penuh 3D baru, yang sepenuhnya mengubah cara AI memahami dunia fisik dan mencapai lompatan dari bidang datar ke tiga dimensi. Selain peningkatan signifikan dalam kemampuan memahami dunia fisik, kemampuan menghasilkan video dari teks juga meningkat secara signifikan. Kejelasan dan konsistensi video yang dihasilkan juga meningkat telah dioptimalkan secara signifikan, dan kecepatan inferensi bahkan lebih tinggi. Mari kita lihat detail pembaruan Open-Sora Plan v1.2.
Open-Sora Plan telah ditingkatkan lagi! Versi terbaru Open-Sora Plan v1.2 memperkenalkan arsitektur perhatian penuh 3D baru, yang meningkatkan pemahaman dunia fisik.
Sorotan utama dari pembaruan ini:
Arsitektur perhatian penuh 3D baru: Arsitektur baru memungkinkan AI membuat lompatan kualitatif dalam memahami dunia fisik. Bukan lagi kode QR yang hanya bisa berpikir dua dimensi, kini bisa memahami dunia tiga dimensi 360 derajat tanpa titik buta!
Kemampuan video pembuatan teks yang ditingkatkan: Anda mengetik sepotong teks, dan AI dapat menyajikan gambar video yang nyata kepada Anda.
Peningkatan kejelasan dan konsistensi: Melalui arsitektur baru dan struktur VAE yang dioptimalkan, kualitas video yang dihasilkan oleh Open-Sora lebih jernih dan konten lebih koheren. Ucapkan selamat tinggal pada ambiguitas!
Integrasi sempurna antara ruang dan waktu: Arsitektur perhatian penuh 3D yang baru memecahkan masalah besar di versi sebelumnya - memproses dimensi ruang dan waktu secara bersamaan. Apa artinya ini? Artinya, video yang dihasilkan akan ditingkatkan secara signifikan dalam hal performa spasial dan kelancaran waktu!
Kecepatan inferensi meningkat pesat: Struktur CausalVideoVAE yang dioptimalkan tidak hanya meningkatkan performa model, namun juga membuat kecepatan inferensi melonjak. Pesta efisiensi bersorak!
Melihat kembali sejarah perkembangan Open-Sora, kita akan menemukan bahwa kemajuannya sungguh menakjubkan. Baru-baru ini pada Mei 2024, versi v1.1.0 masih menggunakan arsitektur model 2+1D, terutama digunakan untuk pelatihan eksplorasi. Dan sekarang, hanya beberapa bulan kemudian, ia telah berevolusi menjadi pencipta yang dapat menciptakan dunia 3D! Dengan kecepatan seperti itu, bahkan Darwin pun akan berseru: Teori evolusi akan segera ditulis ulang!
Yang paling keren adalah tim Open-Sora tidak menyembunyikan apa pun! Kode, data, dan model semuanya open source, dan mereka hanya menempelkan instruksi tentang cara menciptakan dunia di wajah Anda. Tujuan mereka sederhana: menjadikan semua orang sebagai dewa pembuatan video! Sikap terbuka dan berbagi ini pasti akan mempercepat kemajuan teknologi pembuatan video AI.
Peluncuran Open-Sora Plan v1.2.0 menandai era baru untuk model pembuatan video. Ini tidak hanya secara signifikan meningkatkan kompresi representasi visual dan efisiensi penalaran, tetapi juga menunjukkan arah pengembangan di masa depan.
Alamat proyek: https://top.aibase.com/tool/open-sora-plan-v1-2
Peluncuran Open-Sora Plan v1.2 menandakan bahwa teknologi pembuatan video AI telah memasuki tahap perkembangan baru, dan fitur open source-nya juga memberikan dorongan kuat bagi kemajuan teknologi. Kami menantikan lebih banyak kejutan yang dapat dihadirkan Open-Sora di masa depan!