Wen Wang 1,2 , Qiuyu Wang 2 , Kecheng Zheng 2 , Hao Ouyang 2 , Zhekai Chen 1 , Biao Gong 2 , Hao Chen 1 ,
Yujun Shen 2 , Chunhua Shen 1
1 Universitas Zhejiang, Cina, 2 Grup Semut
Kami mengusulkan Framer, metode interpolasi bingkai yang lebih terkendali dan interaktif yang memungkinkan pengguna menghasilkan transisi bingkai yang mulus antara dua gambar dengan menyesuaikan lintasan titik kunci yang dipilih, meningkatkan kontrol, dan menangani kasus yang menantang.
Metode yang diusulkan, Framer, menyediakan interpolasi bingkai interaktif, memungkinkan pengguna untuk menyesuaikan transisi dengan menyesuaikan lintasan titik kunci yang dipilih. Pendekatan ini mengurangi ambiguitas transformasi gambar, memungkinkan kontrol gerakan lokal yang lebih baik dan meningkatkan kemampuan model untuk menangani kasus-kasus sulit (misalnya, objek dengan bentuk dan gaya berbeda). Framer juga menyertakan mode "autopilot" yang secara otomatis memperkirakan titik-titik kunci dan menyempurnakan lintasan, menyederhanakan proses dan memungkinkan hasil yang alami dan koheren secara temporal.
Karya ini menggunakan model difusi gambar-ke-video terlatih berskala besar (Difusi Video Stabil) sebagai model dasar. Ini memperkenalkan pengkondisian bingkai akhir tambahan untuk memfasilitasi interpolasi video dan menggabungkan cabang pengontrol lintasan titik untuk interaksi pengguna.
Framer mengungguli metode interpolasi bingkai yang ada dalam hal kualitas visual dan gerakan alami, terutama dalam kasus yang melibatkan gerakan kompleks dan perubahan tampilan yang signifikan. Evaluasi kuantitatif menggunakan FVD (Fréchet Video Distance) menunjukkan kinerja yang lebih unggul dibandingkan metode lainnya. Studi pengguna menunjukkan preferensi yang kuat terhadap keluaran Framer, menyoroti efektivitasnya dalam memberikan hasil yang realistis dan menarik secara visual.
Perhatikan bahwa video dikompresi secara spasial. Kami merujuk pembaca ke halaman proyek untuk video asli.
Mulai Gambar | Lintasan Masukan & Hasil Interpolasi | Gambar Akhir |
Mulai Gambar | Lintasan Masukan & Hasil Interpolasi | Gambar Akhir |
Mulai Gambar | Hasil Interpolasi | Gambar Akhir |
Mulai Gambar | Hasil Interpolasi | Gambar Akhir |
Mulai Gambar | Hasil Interpolasi | Gambar Akhir |
Mulai Gambar | Hasil Interpolasi | Gambar Akhir |
Silakan pertimbangkan untuk mengutip makalah kami jika kode kami berguna:
@article { wang2024framer ,
title = { Framer: Interactive Video Interpolation } ,
author = { Wang, Wen and Wang, Qiuyu and Zheng, Kecheng and Ouyang, Hao and Chen, Zhekai and Gong, Biao and Chen, Hao and Shen, Yujun and Shen, Chunhua } ,
journal = { arXiv preprint https://arxiv.org/abs/2410.18978 } ,
year = { 2024 }
}
Untuk penggunaan akademis, proyek ini dilisensikan di bawah Lisensi BSD 2-klausul. Untuk penggunaan komersial, silakan hubungi C Shen.