Google a récemment publié son dernier modèle de génération vidéo, VideoPoet, qui peut générer des vidéos d'une durée maximale de 10 secondes et générer automatiquement les effets sonores de la bande sonore correspondante. Différent des modèles de diffusion précédents, VideoPoet utilise un grand modèle de langage, ce qui lui permet d'intégrer de multiples fonctions telles que le texte en vidéo, la réparation vidéo et la stylisation vidéo, améliorant considérablement la flexibilité et l'efficacité d'utilisation. Son mécanisme d'extension vidéo unique crée l'illusion d'une extension infinie de la vidéo en prédisant à plusieurs reprises le contenu de l'image suivante de la dernière image, offrant ainsi aux utilisateurs une nouvelle expérience de génération vidéo.
Le 19 décembre, Google a lancé le modèle de génération vidéo VideoPoet. Ce modèle peut générer des vidéos d'une durée maximale de 10 secondes et peut également générer automatiquement des effets sonores de bande sonore basés sur le contenu vidéo. VideoPoet étend la vidéo en prédisant à plusieurs reprises le contenu de l'image suivante de la dernière image de la vidéo, donnant ainsi à l'utilisateur le sentiment que la vidéo peut être étendue à l'infini. Contrairement à d'autres modèles, VideoPoet utilise un grand modèle de langage au lieu d'un modèle de diffusion, il intègre donc plusieurs fonctions telles que la conversion de texte en vidéo, la réparation vidéo et la stylisation vidéo dans le même modèle, ce qui le rend plus flexible à utiliser.
L'émergence de VideoPoet marque une avancée significative dans la technologie de génération vidéo. Ses fonctions puissantes et ses méthodes de fonctionnement pratiques devraient être largement utilisées dans divers domaines à l'avenir, offrant aux utilisateurs une expérience de création vidéo plus riche et plus pratique. Nous attendons avec impatience que VideoPoet apporte des fonctionnalités et des applications plus surprenantes à l'avenir.