王文1,2 、王秋雨2 、鄭克成2 、歐陽浩2 、陳哲凱1 、龔彪2 、陳浩1 、
沉玉軍2 ,沈春華1
1浙江大學,中國, 2螞蟻集團
我們提出了Framer,一種更可控和互動的幀插值方法,允許使用者透過自訂選定關鍵點的軌跡、增強控制和處理具有挑戰性的情況來產生兩個影像之間的平滑過渡幀。
所提出的方法 Framer 提供互動式影格插值,讓使用者可以透過自訂所選關鍵點的軌跡來客製化過渡。這種方法減輕了影像變換的模糊性,能夠更精細地控制局部運動,並提高模型處理具有挑戰性的情況(例如,具有不同形狀和樣式的物件)的能力。 Framer 還包括「自動駕駛」模式,可自動估計關鍵點並細化軌跡,從而簡化流程並實現運動自然且時間連貫的結果。
這項工作利用大規模預訓練的影像到視訊擴散模型(穩定視訊擴散)作為基礎模型。它引入了額外的端幀調節以促進視訊插值,並結合了用於用戶互動的點軌跡控制分支。
Framer 在視覺品質和自然運動方面優於現有的幀插值方法,特別是在涉及複雜運動和顯著外觀變化的情況下。與其他方法相比,使用 FVD(Fréchet Video Distance)進行的定量評估表現出優越的性能。使用者研究顯示對 Framer 輸出的強烈偏好,強調了其在產生逼真且視覺上吸引人的結果方面的有效性。
請注意,影片是空間壓縮的。我們建議讀者訪問項目頁面以獲取原始視頻。
起始影像 | 輸入軌跡和插值結果 | 結束影像 |
起始影像 | 輸入軌跡和插值結果 | 結束影像 |
起始影像 | 插值結果 | 結束影像 |
起始影像 | 插值結果 | 結束影像 |
起始影像 | 插值結果 | 結束影像 |
起始影像 | 插值結果 | 結束影像 |
如果我們的程式碼有用,請考慮引用我們的論文:
@article { wang2024framer ,
title = { Framer: Interactive Video Interpolation } ,
author = { Wang, Wen and Wang, Qiuyu and Zheng, Kecheng and Ouyang, Hao and Chen, Zhekai and Gong, Biao and Chen, Hao and Shen, Yujun and Shen, Chunhua } ,
journal = { arXiv preprint https://arxiv.org/abs/2410.18978 } ,
year = { 2024 }
}
對於學術用途,該計畫根據 2 條款 BSD 許可證獲得許可。如需商業用途,請聯絡C Shen。