Shanghai Jiyue Xingchen Intelligent Technology Co., Ltd. a publié sa version V2 de son modèle de génération de vidéos Step-video le 22 janvier 2025. Cette version a été considérablement améliorée sous de nombreux aspects, comme l'utilisation de modèles VAE plus efficaces et des architectures DIT optimisées pour améliorer l'efficacité et la qualité de la génération vidéo. En outre, Step-Video V2 combine également la compréhension multimode auto-développée du grand modèle et de la base de connaissances vidéo, en rapprochant les vidéos générées du monde réel, et a ajouté des fonctions de génération de texte de base pour étendre davantage le scénario d'application. La mise à niveau montre la puissante force technique de Jie Xingchen dans le domaine de la génération de vidéos, offrant des outils plus puissants pour la création de vidéos.
Le 22 janvier 2025, Shanghai Jiyin Xingchen Intelligent Technology Co., Ltd. a annoncé que son modèle de génération de vidéos Step-video a été officiellement mis à niveau vers la version V2. Cette mise à niveau a apporté des percées technologiques importantes et une amélioration des fonctions, ce qui la rend plus puissante dans la simulation du monde réel.
La version Step-Video V2 a optimisé et innové dans plusieurs domaines technologiques de base. Tout d'abord, cette version utilise un modèle VAE plus comprimé. Deuxièmement, Step-Video V2 a profondément optimisé l'architecture DIT et introduit un algorithme d'apprentissage amélioré pour améliorer davantage les expressions de douceur et de détail de la génération vidéo. En outre, cette version combine également la compréhension multi-modes en mode auto-développée du grand modèle et de la base de connaissances vidéo, qui peut décrire plus précisément le contenu vidéo et la langue de l'objectif, et générer des vidéos plus près du monde réel.
Dans les applications pratiques, Step-Video V2 montre une puissante capacité de génération de mouvement complexe. Dans le même temps, ce modèle est bien réalisé dans la capture du caractère du caractère et peut exquiser l'expression et l'effet léger et ombre des personnages réels ou des caractères fictifs. De plus, Step-Video V2 prend également en charge le langage de l'objectif riche, y compris diverses méthodes sportives telles que Push, Tirling, Shaking and Move, et le changement entre différentes scènes, offrant plus de possibilités de création vidéo.
Il convient de mentionner que Step-Video V2 a ajouté une fonction de base basée sur le texte, qui peut naturellement intégrer du texte dans le contenu vidéo, et l'effet de génération est nettement meilleur que le modèle de génération précédente. L'ajout de cette fonction étend encore le scénario d'application de la génération de vidéos.
À l'heure actuelle, Step-Video V2 a ouvert une application d'essai sur la page Web Jumping (https://yuewen.cn/videos), et les utilisateurs peuvent découvrir les fonctionnalités puissantes de cette mise à niveau.
Cette mise à niveau marque non seulement la progression technique de Jie Xingchen dans le domaine de la génération de vidéos, mais fournit également des outils plus puissants pour que les créateurs favorisent la création vidéo dans une nouvelle étape.
La mise à niveau de Step-Video V2 a apporté de nouvelles possibilités dans le domaine de la création vidéo.