A equipe GenAI da Meta lançou um novo modelo de geração de vídeo para vídeo chamado Fairy, que supera significativamente as tecnologias existentes em termos de velocidade e consistência temporal. Fairy consegue síntese de vídeo de alta fidelidade através de um inovador mecanismo de atenção cross-frame, aumentando a velocidade em até 44 vezes. Este é sem dúvida um grande avanço no campo da geração de vídeo, proporcionando novas possibilidades para edição e criação de vídeo mais rápidas e eficientes no futuro.
A equipe GenAI da Meta lançou um modelo de síntese de vídeo para vídeo chamado Fairy, que é mais rápido e mais consistente em termos de tempo do que os modelos existentes. Fairy usa um mecanismo de atenção cross-frame para garantir consistência temporal e composição de alta fidelidade. Fairy é 44 vezes mais rápido que o modelo anterior, mas ainda apresenta alguns problemas ao lidar com efeitos ambientais dinâmicos.
Embora o modelo Fairy tenha feito avanços em velocidade, ainda há espaço para melhorias ao lidar com cenas dinâmicas complexas. No futuro, otimizar ainda mais a robustez do modelo para que ele possa lidar melhor com várias cenas de vídeo complexas será uma direção importante para a equipe de pesquisa. Esperamos que o modelo Fairy seja aprimorado ainda mais em atualizações futuras para oferecer aos usuários uma experiência de geração de vídeo mais perfeita.