O Laboratório S da Universidade Tecnológica de Nanyang lançou um modelo de vídeo Vincent inovador chamado FreeInit e abriu o código-fonte de seu código e documentos. Este modelo visa resolver os problemas de consistência temporal insuficiente e efeitos dinâmicos não naturais dos modelos de difusão de vídeo existentes na geração de vídeos. O FreeInit melhora a consistência temporal ao reinicializar o ruído e melhora a qualidade das informações de baixa frequência por meio de múltiplas iterações, melhorando em última análise a qualidade e a consistência temporal dos vídeos gerados, fornecendo novas ideias e ferramentas para pesquisa na área de geração de vídeo. O código aberto dos resultados da pesquisa ajudará a academia e a indústria a explorar e desenvolver ainda mais a tecnologia de geração de vídeo.
Pesquisadores do S Lab da Universidade Tecnológica de Nanyang abriram o código-fonte de um modelo de vídeo Vincent inovador chamado FreeInit. Eles descobriram que o modelo de difusão de vídeo sofre de consistência temporal insuficiente e efeitos dinâmicos não naturais ao gerar vídeos. Para resolver este problema, eles propuseram um método para melhorar a consistência temporal reinicializando o ruído. Eles abriram o código e os documentos do FreeInit para os pesquisadores consultarem e usarem. Através de iterações repetidas, o FreeInit pode acumular e melhorar ainda mais a qualidade das informações de baixa frequência, preenchendo gradualmente a lacuna de inicialização entre o treinamento e a inferência, melhorando assim a qualidade e a consistência temporal dos vídeos gerados.
O código aberto do modelo FreeInit fornece recursos valiosos para o desenvolvimento de tecnologia de geração de vídeo e também fornece aos pesquisadores novas direções e ideias de pesquisa. Acredito que haverá aplicações mais inovadoras baseadas neste modelo no futuro, promovendo ainda mais o vídeo Wensheng. progresso tecnológico.