Alibaba meluncurkan model video teks + gambar AtomoVideo, sebanding dengan Gen-2 dan Pika

Penulis：Eve Cole Waktu Pembaruan：2025-01-04 19:48:01

Tim teknis Alibaba baru-baru ini merilis model AtomoVideo, model AI yang dapat menghasilkan video dengan fidelitas tinggi berdasarkan teks dan gambar. Terobosan teknis model ini terletak pada injeksi gambar multi-granularitas yang inovatif dan teknologi pemodelan temporal, yang telah menunjukkan kinerja yang sebanding dengan model komersial dalam evaluasi. Hal ini menandai kemajuan yang signifikan dalam bidang pembuatan video, menghadirkan kemungkinan tak terbatas untuk pembuatan konten video di masa depan, dan juga menandai berlanjutnya terobosan AI dalam bidang pembuatan konten multi-modal.

Tim teknis Alibaba meluncurkan model AtomoVideo, yang dapat menghasilkan video dengan ketelitian tinggi dari teks dan gambar. Inovasi teknis mencakup injeksi gambar multi-granularitas dan pemodelan waktu. Evaluasi menunjukkan bahwa model ini sebanding dengan model komersial, membawa kemungkinan baru di bidang pembuatan video.

Kemunculan model AtomoVideo tidak hanya meningkatkan efisiensi dan kualitas pembuatan video, namun juga menyediakan alat dan ide baru untuk pembuatan konten video di semua lapisan masyarakat. Di masa depan, dengan kemajuan teknologi yang berkelanjutan, saya yakin model AtomoVideo akan berperan di lebih banyak bidang dan menghadirkan lebih banyak konten video menarik bagi kita.