Step Star a récemment publié le très attendu modèle de génération d'images à grande échelle Step-1X, que les utilisateurs peuvent découvrir après s'être inscrits dans son centre d'expérience de plateforme ouverte. Ce grand modèle a été lancé avec Step-2 et Step-1.5V lors de la Conférence mondiale sur l'intelligence artificielle de 2024, et sa solidité technique et ses perspectives d'application ont attiré beaucoup d'attention. Step-1X est basé sur l'architecture de modèle DiT auto-développée, mettant l'accent sur un alignement sémantique profond et la génération de détails. Il peut comprendre des instructions complexes et prendre en charge des instructions de génération d'images jusqu'à 2 000 caractères. Il a une large valeur d'application dans la créativité publicitaire, l'art du jeu et le cinéma. et la production télévisuelle et d'autres domaines.
Step Star a récemment officiellement lancé le très attendu modèle de génération d'images à grande échelle Step-1X dans son centre d'expérience de plate-forme ouverte. Les utilisateurs peuvent en faire l'expérience après s'être inscrits. Ce grand modèle a fait ses débuts lors de la Conférence mondiale sur l'intelligence artificielle de 2024 et a été publié avec le grand modèle Step-2, un langage à mille milliards de paramètres, et le grand modèle multimodal Step-1.5V.
Cette fois, le modèle de génération d'images à grande échelle Step-1X a également coopéré avec Shanghai Film pour développer une expérience interactive H5 « Test Which God You Are » basée sur l'IP classique « Havoc in Heaven Bien que les ressources de données de « Havoc in Heaven ». " sont rares, Step -1X peut toujours réaliser une génération de haute qualité dans des conditions de données limitées.
Step-1X met l'accent sur l'alignement sémantique profond et la génération de détails, et adopte l'architecture de modèle DiT (Diffusion Models with Transformer) auto-développée, qui peut comprendre avec précision des instructions complexes et prendre en charge des instructions de génération d'images allant jusqu'à 2 000 caractères.
Sa flexibilité le rend largement applicable à divers scénarios tels que la créativité publicitaire, l'art du jeu, la production cinématographique et télévisuelle, etc. Surtout lorsqu'il s'agit d'éléments et de culture chinois, Step-1X présente des avantages d'optimisation uniques et peut mieux transmettre l'essence de la culture.
Lien d'expérience : https://platform.stepfun.com/console-tools?model=step-1x-medium
Le lancement de Step-1X marque les progrès significatifs de Step Star dans le domaine de la génération d'images IA. Ses puissantes performances et ses capacités de compréhension culturelle offrent aux utilisateurs une nouvelle expérience créative. À l’avenir, nous espérons que Step-1X montrera son potentiel dans davantage de domaines.