Laboratorium S Universitas Teknologi Nanyang merilis model video Vincent inovatif yang disebut FreeInit dan membuat kode serta makalahnya menjadi sumber terbuka. Model ini bertujuan untuk memecahkan masalah konsistensi temporal yang tidak mencukupi dan efek dinamis yang tidak wajar dari model difusi video yang ada saat membuat video. FreeInit meningkatkan konsistensi temporal dengan menginisialisasi ulang noise, dan meningkatkan kualitas informasi frekuensi rendah melalui beberapa iterasi, yang pada akhirnya meningkatkan kualitas dan konsistensi temporal dari video yang dihasilkan, memberikan ide dan alat baru untuk penelitian di bidang pembuatan video. Hasil penelitian yang bersifat open source akan membantu akademisi dan industri lebih jauh mengeksplorasi dan mengembangkan teknologi pembuatan video.
Para peneliti dari S Lab Universitas Teknologi Nanyang telah membuat model video Vincent inovatif yang disebut FreeInit menjadi sumber terbuka. Mereka menemukan bahwa model difusi video mengalami konsistensi temporal yang tidak memadai dan efek dinamis yang tidak wajar saat membuat video. Untuk mengatasi masalah ini, mereka mengusulkan metode untuk meningkatkan konsistensi temporal dengan menginisialisasi ulang noise. Mereka telah membuat kode dan makalah FreeInit menjadi sumber terbuka untuk dirujuk dan digunakan oleh para peneliti. Melalui iterasi yang berulang-ulang, FreeInit selanjutnya dapat mengakumulasi dan meningkatkan kualitas informasi frekuensi rendah, secara bertahap menjembatani kesenjangan inisialisasi antara pelatihan dan inferensi, sehingga meningkatkan kualitas dan konsistensi temporal dari video yang dihasilkan.
Model FreeInit yang bersifat open source menyediakan sumber daya berharga untuk pengembangan teknologi pembuatan video, dan juga memberikan arahan dan ide penelitian baru kepada para peneliti. Saya yakin akan ada lebih banyak aplikasi inovatif berdasarkan model ini di masa depan, yang selanjutnya mempromosikan video Wensheng kemajuan teknologi.