Le laboratoire S de l'université technologique de Nanyang a publié un modèle vidéo innovant de Vincent appelé FreeInit et a ouvert son code et ses documents. Ce modèle vise à résoudre les problèmes de cohérence temporelle insuffisante et d'effets dynamiques non naturels des modèles de diffusion vidéo existants lors de la génération de vidéos. FreeInit améliore la cohérence temporelle en réinitialisant le bruit et améliore la qualité des informations basse fréquence grâce à de multiples itérations, améliorant finalement la qualité et la cohérence temporelle des vidéos générées, fournissant ainsi de nouvelles idées et outils de recherche dans le domaine de la génération vidéo. La source ouverte des résultats de la recherche aidera le monde universitaire et l’industrie à explorer et à développer davantage la technologie de génération vidéo.
Des chercheurs du S Lab de l'Université technologique de Nanyang ont ouvert un modèle vidéo innovant de Vincent appelé FreeInit. Ils ont constaté que le modèle de diffusion vidéo souffre d’une cohérence temporelle insuffisante et d’effets dynamiques non naturels lors de la génération de vidéos. Pour résoudre ce problème, ils ont proposé une méthode permettant d'améliorer la cohérence temporelle en réinitialisant le bruit. Ils ont ouvert le code et les articles FreeInit que les chercheurs peuvent consulter et utiliser. Grâce à des itérations répétées, FreeInit peut accumuler et améliorer davantage la qualité des informations basse fréquence, combler progressivement le fossé d'initialisation entre la formation et l'inférence, améliorant ainsi la qualité et la cohérence temporelle des vidéos générées.
L'open source du modèle FreeInit fournit des ressources précieuses pour le développement de la technologie de génération vidéo et fournit également aux chercheurs de nouvelles orientations et idées de recherche. Je pense qu'il y aura des applications plus innovantes basées sur ce modèle à l'avenir, promouvant davantage la vidéo Wensheng. progrès technologique.