Google lanza el modelo de generación de vídeo VideoPoet, que admite la generación de vídeo y audio de diez segundos de duración

Autor：Eve Cole Fecha de actualización：2025-01-12 09:32:02

Google lanzó recientemente su último modelo de generación de videos, VideoPoet, que puede generar videos de hasta 10 segundos de duración y generar automáticamente los efectos de sonido de la banda sonora correspondiente. A diferencia de los modelos de difusión anteriores, VideoPoet utiliza un modelo de lenguaje grande, que le permite integrar múltiples funciones como texto a video, reparación de video y estilización de video, mejorando en gran medida la flexibilidad y eficiencia de uso. Su exclusivo mecanismo de extensión de video crea la ilusión de una extensión infinita del video al predecir repetidamente el contenido del siguiente fotograma del último, brindando a los usuarios una nueva experiencia de generación de video.

El 19 de diciembre, Google lanzó el modelo de generación de vídeo VideoPoet. Este modelo puede generar videos de hasta 10 segundos de duración y también puede generar automáticamente efectos de sonido de banda sonora basados en el contenido del video. VideoPoet extiende el video prediciendo repetidamente el contenido del siguiente cuadro del último cuadro del video, lo que hace que el usuario sienta que el video se puede extender infinitamente. A diferencia de otros modelos, VideoPoet utiliza un modelo de lenguaje grande en lugar de un modelo de difusión, por lo que integra múltiples funciones como texto a video, reparación de video y estilización de video en el mismo modelo, lo que lo hace más flexible de usar.

La aparición de VideoPoet marca un avance significativo en la tecnología de generación de videos. Se espera que sus poderosas funciones y métodos de operación convenientes se utilicen ampliamente en diversos campos en el futuro, brindando a los usuarios una experiencia de creación de videos más rica y conveniente. Esperamos que VideoPoet traiga más funciones y aplicaciones sorprendentes en el futuro.