Google a publié un nouveau modèle de génération vidéo, Veo2, conçu pour concurrencer Sora d'OpenAI. Veo2 a considérablement amélioré le réalisme vidéo et les performances détaillées, et possède une compréhension plus approfondie des lois physiques, des mouvements humains et des changements subtils dans les expressions. Cette mise à jour améliore non seulement la qualité vidéo, mais améliore également la capacité du modèle à comprendre et à exécuter les instructions de l'utilisateur, fournissant ainsi un outil de création vidéo plus puissant. Grâce à la plate-forme VideoFX de Google Labs, les utilisateurs peuvent découvrir les puissantes fonctionnalités de Veo2, générer des vidéos avec une résolution allant jusqu'à 4K et choisir les types de vidéo, les objectifs et les effets de film. Cependant, il convient de noter que Veo2 n'est actuellement disponible que pour les utilisateurs figurant sur la liste d'attente et qu'ils doivent postuler via le formulaire Google.
Google a officiellement publié son modèle de génération vidéo de nouvelle génération Veo2, visant à concurrencer Sora d'OpenAI. Google affirme que Veo2 présente un plus grand réalisme et plus de détails lors de la génération de vidéos. Cette mise à jour améliore non seulement la qualité vidéo, mais améliore également la compréhension de la physique réelle et des nuances du mouvement et de l'expression humains.
La puissance de Veo2
Google affirme que Veo2 a « une meilleure compréhension de la physique du monde réel et des nuances du mouvement et de l'expression humaine ». Il est disponible sur la plateforme VideoFX de Google Labs, mais uniquement sur liste d'attente. Les utilisateurs doivent s'inscrire via un formulaire Google et attendre que Google accorde temporairement l'accès au moment de leur choix.
Google a déclaré que les utilisateurs peuvent choisir le type de vidéo, d'objectif et d'effets de film en fonction de leurs besoins, et Veo2 sera en mesure de générer des vidéos avec une résolution allant jusqu'à 4K.
En revanche, le Veo original est toujours disponible sur Vertex AI, et les vidéos générées par Veo2 seront accompagnées du filigrane de métadonnées de Google, SynthID, pour les identifier comme contenu généré par l'IA.
Malgré les avancées techniques du Veo2, Google admet que le modèle présente occasionnellement des « hallucinations » telles que des doigts supplémentaires, mais dans l'ensemble, la nouvelle version produit moins d'hallucinations.
Google a déclaré que dans ses propres tests internes, qui mesurent la « préférence globale » (c'est-à-dire quelles vidéos les téléspectateurs préfèrent) et la « conformité en temps opportun » (dans quelle mesure une vidéo correspond aux instructions données par les créateurs humains), les évaluateurs humains ont préféré Veo, par opposition à l'artificiel. modèles d'intelligence de Sora et d'autres concurrents.
Entrée expérience Veo2 : https://labs.google/fx/tools/video-fx
Entrée d'introduction : https://deepmind.google/technologies/veo/veo-2/
La génération de vidéo IA a encore besoin de travail
Même si la technologie de génération de vidéo IA s’améliore constamment, la concurrence entre Google et des acteurs majeurs comme OpenAI reste féroce. D'autres petites entreprises, telles que RunwayML et Luma AI, déploient également de nouvelles fonctionnalités pour améliorer leurs capacités de génération vidéo.
Récemment, RunwayML a introduit des fonctionnalités de contrôle avancées pour le modèle Gen-3Alpha Turbo, tandis que Pika Labs a publié Pika 2.0, permettant aux utilisateurs d'ajouter leurs propres personnages aux vidéos.
Cependant, la confiance des utilisateurs dans les vidéos générées par l’IA est encore insuffisante. La sortie de Sora n'a pas complètement éliminé les doutes des gens, et certains utilisateurs ont signalé que les résultats générés présentaient des violations physiques et anatomiques. De plus, les téléspectateurs lors des récentes remises de prix du jeu ont exprimé leur mécontentement face au « chaos de l’IA » du contenu généré par l’IA.
Google a déclaré que de nombreux utilisateurs ont exprimé un vif intérêt pour Veo2, en particulier certains créateurs YouTube qui utilisent déjà VideoFX pour créer des arrière-plans pour leurs courtes vidéos afin de gagner du temps.
Mises à jour d'Imagen3
En plus de Veo2, Google a également mis à jour son modèle de génération d'images Imagen3, qui améliore encore le réalisme et la vivacité des couleurs des images générées. La nouvelle version d'Imagen3 peut représenter avec plus de précision une variété de styles artistiques, du réalisme photographique à l'impressionnisme, en passant par les styles abstraits et animés. Dans le même temps, le modèle a également mieux suivi les instructions de l’utilisateur.
Souligner:
- Google publie le modèle de génération vidéo Veo2, affirmant que sa qualité vidéo est meilleure que celle de Sora d'OpenAI.
- Les utilisateurs peuvent demander à utiliser Veo2 via le formulaire Google et choisir des styles et des effets lors de la génération de vidéos.
- Le modèle de génération d'images Imagen3 mis à jour peut mieux exprimer divers styles artistiques et offrir une meilleure expérience utilisateur.
Dans l’ensemble, l’émergence de Veo2 marque une nouvelle étape dans la technologie de génération vidéo IA, mais elle révèle également que le domaine est encore confronté à de nombreux défis. L’avancement continu de la technologie et l’amélioration de l’expérience utilisateur seront l’orientation future du développement.