El equipo GenAI de Meta ha lanzado un nuevo modelo de generación de vídeo a vídeo llamado Fairy que supera significativamente a las tecnologías existentes en términos de velocidad y coherencia temporal. Fairy logra una síntesis de vídeo de alta fidelidad a través de un innovador mecanismo de atención de fotogramas cruzados, aumentando la velocidad hasta 44 veces. Este es sin duda un avance importante en el campo de la generación de videos, ya que brindará nuevas posibilidades para una edición y creación de videos más rápida y eficiente en el futuro.
El equipo GenAI de Meta ha lanzado un modelo de síntesis de vídeo a vídeo llamado Fairy que es más rápido y más consistente en el tiempo que los modelos existentes. Fairy utiliza un mecanismo de atención entre cuadros para garantizar la coherencia temporal y la composición de alta fidelidad. Fairy es 44 veces más rápido que el modelo anterior, pero todavía tiene algunos problemas para manejar los efectos ambientales dinámicos.
Aunque el modelo Fairy ha logrado avances en velocidad, todavía hay margen de mejora cuando se trata de escenas dinámicas complejas. En el futuro, una dirección importante para el equipo de investigación será optimizar aún más la robustez del modelo para que pueda hacer frente mejor a varias escenas de vídeo complejas. Esperamos que el modelo Fairy se mejore aún más en futuras actualizaciones para brindar a los usuarios una experiencia de generación de videos más perfecta.