เหวิน หวาง 1,2 , ชิวหยู หวัง 2 , เคเฉิง เจิ้ง 2 , ห่าว เฉิน 2 , เจ้อไค เฉิน 1 , เปียวกง 2 , ห่าวเฉิน 1 ,
หยูจุนเซิน 2 , ชุนฮวาเซิน 1
1 มหาวิทยาลัยเจ้อเจียง ประเทศจีน 2 กลุ่ม Ant
เราขอเสนอ Framer ซึ่งเป็นวิธีการแก้ไขเฟรมแบบโต้ตอบที่สามารถควบคุมได้มากขึ้น ซึ่งช่วยให้ผู้ใช้สามารถสร้างเฟรมการเปลี่ยนภาพระหว่างสองภาพได้อย่างราบรื่น โดยการปรับแต่งวิถีของจุดสำคัญที่เลือก ปรับปรุงการควบคุมและจัดการกับกรณีที่ท้าทาย
Framer วิธีการที่เสนอให้การแก้ไขเฟรมแบบโต้ตอบ ช่วยให้ผู้ใช้ปรับแต่งการเปลี่ยนผ่านโดยปรับแต่งวิถีของจุดสำคัญที่เลือก วิธีการนี้ช่วยลดความคลุมเครือของการแปลงภาพ ช่วยให้สามารถควบคุมการเคลื่อนไหวในท้องถิ่นได้ละเอียดยิ่งขึ้น และปรับปรุงความสามารถของแบบจำลองในการจัดการกรณีที่ท้าทาย (เช่น วัตถุที่มีรูปร่างและสไตล์ที่แตกต่างกัน) Framer ยังมีโหมด "อัตโนมัติ" ที่จะประมาณจุดสำคัญโดยอัตโนมัติและปรับแต่งวิถี ทำให้กระบวนการง่ายขึ้นและทำให้ได้ผลลัพธ์ที่เป็นธรรมชาติและสอดคล้องกันชั่วคราว
งานนี้ใช้โมเดลการแพร่กระจายภาพสู่วิดีโอขนาดใหญ่ที่ได้รับการฝึกล่วงหน้าขนาดใหญ่ (Stable Video Diffusion) เป็นโมเดลพื้นฐาน แนะนำการปรับสภาพเฟรมท้ายเพิ่มเติมเพื่ออำนวยความสะดวกในการแก้ไขวิดีโอ และรวมสาขาการควบคุมวิถีจุดสำหรับการโต้ตอบของผู้ใช้
Framer มีประสิทธิภาพเหนือกว่าวิธีการแก้ไขเฟรมที่มีอยู่ในแง่ของคุณภาพของภาพและการเคลื่อนไหวที่เป็นธรรมชาติ โดยเฉพาะอย่างยิ่งในกรณีที่เกี่ยวข้องกับการเคลื่อนไหวที่ซับซ้อนและการเปลี่ยนแปลงรูปลักษณ์ที่สำคัญ การประเมินเชิงปริมาณโดยใช้ FVD (Fréchet Video Distance) แสดงให้เห็นประสิทธิภาพที่เหนือกว่าเมื่อเปรียบเทียบกับวิธีอื่นๆ การศึกษาผู้ใช้แสดงให้เห็นถึงความพึงพอใจอย่างมากต่อผลงานของ Framer โดยเน้นย้ำถึงประสิทธิภาพในการสร้างผลลัพธ์ที่สมจริงและน่าดึงดูดสายตา
โปรดทราบว่าวิดีโอมีการบีบอัดเชิงพื้นที่ เราอ้างอิงผู้อ่านไปยังหน้าโครงการสำหรับวิดีโอต้นฉบับ
เริ่มภาพ | ป้อนวิถีและผลลัพธ์การแก้ไข | สิ้นสุดภาพ |
เริ่มภาพ | ป้อนวิถีและผลลัพธ์การแก้ไข | สิ้นสุดภาพ |
เริ่มภาพ | ผลการแก้ไข | สิ้นสุดภาพ |
เริ่มภาพ | ผลการแก้ไข | สิ้นสุดภาพ |
เริ่มภาพ | ผลการแก้ไข | สิ้นสุดภาพ |
เริ่มภาพ | ผลการแก้ไข | สิ้นสุดภาพ |
โปรดพิจารณาอ้างอิงเอกสารของเราหากรหัสของเรามีประโยชน์:
@article { wang2024framer ,
title = { Framer: Interactive Video Interpolation } ,
author = { Wang, Wen and Wang, Qiuyu and Zheng, Kecheng and Ouyang, Hao and Chen, Zhekai and Gong, Biao and Chen, Hao and Shen, Yujun and Shen, Chunhua } ,
journal = { arXiv preprint https://arxiv.org/abs/2410.18978 } ,
year = { 2024 }
}
สำหรับการใช้งานเชิงวิชาการ โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต BSD 2 ข้อ สำหรับการใช้งานเชิงพาณิชย์ โปรดติดต่อ C Shen