Google a récemment lancé un outil d'IA appelé VLOGGER, capable de générer des vidéos parlantes réalistes basées sur une seule photo. La technologie est basée sur une technologie textuelle et audio et offre des capacités d'édition vidéo uniques, telles que la modification des expressions des personnages, l'ajustement de la fermeture de la bouche et même la traduction de vidéos existantes. Comparé à l'EMO d'Alibaba, VLOGGER est supérieur en termes de fonctions de montage vidéo. Bien que l'effet actuel de la génération vidéo doive encore être amélioré, ses tentatives innovantes dans le domaine de la génération vidéo IA méritent l'attention.
Google lance VLOGGER, un outil qui génère des vidéos d'humains qui parlent à partir d'une seule photo, basé sur du texte et une technologie audio pilotée. Par rapport à l'EMO d'Alibaba, VLOGGER dispose d'une fonction d'édition vidéo qui peut modifier les expressions, ajuster la fermeture de la bouche et éditer des vidéos existantes pour les traduire. Bien que techniquement unique, VLOGGER doit encore améliorer sa génération vidéo.
L'émergence de VLOGGER marque une nouvelle avancée dans la technologie de génération vidéo AI, et ses fonctions d'édition vidéo uniques offrent aux utilisateurs des possibilités plus créatives. À l'avenir, à mesure que la technologie continue de mûrir, je pense que VLOGGER peut jouer un rôle plus important dans le domaine de la création vidéo et offrir aux utilisateurs une expérience vidéo plus pratique et plus riche. Nous attendons avec impatience de nouvelles améliorations de VLOGGER à l'avenir pour apporter des effets de génération vidéo plus époustouflants.