Google actualiza el modelo de generación de video AI Veo2, resolución 4K, la puntuación de preferencia humana es mejor que Sora

Autor：Eve Cole Fecha de actualización：2024-12-19 12:32:01

Google ha lanzado un nuevo modelo de generación de vídeo, Veo2, diseñado para competir con Sora de OpenAI. Veo2 ha mejorado significativamente el realismo del vídeo y el rendimiento detallado, y tiene una comprensión más profunda de las leyes físicas, el movimiento humano y los cambios sutiles en las expresiones. Esta actualización no solo mejora la calidad del video, sino que también mejora la capacidad del modelo para comprender y ejecutar instrucciones del usuario, proporcionando una herramienta más poderosa para la creación de videos. A través de la plataforma VideoFX de Google Labs, los usuarios pueden experimentar las poderosas funciones de Veo2, generar videos con una resolución de hasta 4K y elegir tipos de video, lentes y efectos de película. Sin embargo, cabe señalar que Veo2 actualmente solo está disponible para usuarios en lista de espera y deben presentar su solicitud a través del formulario de Google.

Google lanzó oficialmente su modelo de generación de video Veo2 de nueva generación, con el objetivo de competir con Sora de OpenAI. Google dice que Veo2 muestra mayor realismo y detalle al generar videos. Esta actualización no sólo mejora la calidad del vídeo sino que también mejora la comprensión de la física de la vida real y los matices del movimiento y la expresión humanos.

El poder de Veo2

Google dice que Veo2 tiene "una mejor comprensión de la física del mundo real y los matices del movimiento y la expresión humanos". Está disponible en la plataforma VideoFX de Google Labs, pero solo en lista de espera. Los usuarios deben registrarse a través de un formulario de Google y esperar a que Google les otorgue acceso temporalmente en el momento que elijan.

Google dijo que los usuarios pueden elegir el tipo de vídeo, lente y efectos de película según sus necesidades, y Veo2 podrá generar vídeos con una resolución de hasta 4K.

Por el contrario, el Veo original todavía está disponible en Vertex AI, y los vídeos generados por Veo2 irán acompañados de la marca de agua de metadatos de Google SynthID para identificarlo como contenido generado por IA.

A pesar de los avances técnicos de Veo2, Google admite que el modelo ocasionalmente presenta "alucinaciones", como dedos adicionales, pero en general la nueva versión produce menos alucinaciones.

Google dijo que en sus propias pruebas internas, que miden la "preferencia general" (es decir, qué vídeos prefieren los espectadores) y el "cumplimiento oportuno" (qué tan bien un vídeo coincide con las instrucciones dadas por los creadores humanos), los evaluadores humanos prefirieron Veo, en lugar del artificial. Modelos de inteligencia de Sora y otros competidores.

Entrada a la experiencia Veo2: https://labs.google/fx/tools/video-fx

Entrada de introducción: https://deepmind.google/technologies/veo/veo-2/

La generación de vídeo con IA todavía necesita trabajo

Aunque la tecnología de generación de vídeos con IA mejora constantemente, la competencia entre Google y los principales actores como OpenAI sigue siendo feroz. Otras empresas más pequeñas, como RunwayML y Luma AI, también están implementando nuevas funciones para mejorar sus capacidades de generación de video.

Recientemente, RunwayML introdujo funciones de control avanzadas para el modelo Gen-3Alpha Turbo, mientras que Pika Labs lanzó Pika 2.0, que permite a los usuarios agregar sus propios personajes a los videos.

Sin embargo, la confianza de los usuarios en los vídeos generados por IA sigue siendo insuficiente. La publicación de Sora no despejó por completo las dudas de la gente, y algunos usuarios informaron que los resultados generados tenían violaciones físicas y anatómicas. Además, los espectadores en recientes entregas de premios de juegos expresaron su insatisfacción con el “caos de IA” del contenido generado por IA.

Google dijo que muchos usuarios han expresado un gran interés en Veo2, especialmente algunos creadores de YouTube que ya están usando VideoFX para crear fondos para sus videos cortos para ahorrar tiempo.

Actualizaciones de Imagen3

Además de Veo2, Google también ha actualizado su modelo de generación de imágenes Imagen3, que mejora aún más el realismo y la intensidad del color de las imágenes generadas. La nueva versión de Imagen3 puede representar con mayor precisión una variedad de estilos artísticos, desde el realismo fotográfico hasta el impresionismo, pasando por estilos abstractos y anime. Al mismo tiempo, el modelo también obtuvo mejores resultados a la hora de seguir las instrucciones del usuario.

Destacar:

- Google lanza el modelo de generación de vídeo Veo2, afirmando que su calidad de vídeo es mejor que la de Sora de OpenAI.

- Los usuarios pueden solicitar el uso de Veo2 a través del formulario de Google y pueden elegir estilos y efectos al generar videos.

- El modelo de generación de imágenes Imagen3 actualizado puede expresar mejor varios estilos artísticos y brindar una mejor experiencia de usuario.

Con todo, la aparición de Veo2 marca otro paso adelante en la tecnología de generación de vídeo con IA, pero también revela que el campo aún enfrenta muchos desafíos. El avance continuo de la tecnología y la mejora de la experiencia del usuario serán la dirección del desarrollo futuro.