Stabilité AI annonce le lancement de STABLE Diffusion 3.5 Medium, un nouvel outil de peinture commercial gratuit, menant à nouveau l'innovation de la technologie de peinture de l'IA. Avec ses hautes performances et son faible seuil, ce modèle apporte des capacités de peinture AI avancées au public, réalisant vraiment la vision de "tout le monde peut utiliser". Il adopte une conception de paramètres rationalisée de 2,5 milliards, ce qui ne nécessite que 9,9 Go de mémoire vidéo pour fonctionner en douceur, en franchissant les limites matérielles des utilisateurs ordinaires et en réduisant considérablement le seuil de la peinture de l'IA.
La stabilité AI perd de nouveau les barrières techniques et lance le nouveau modèle stable diffusion3.5medium. Cet outil de peinture sur l'IA pour le public est non seulement entièrement libre et ouvert pour une utilisation commerciale, mais plus important encore, il réalise un équilibre parfait entre les performances élevées et la popularisation.
Ce modèle, qui adopte l'architecture du convertisseur de diffusion multimodal (MMDIT-X), a une conception rationalisée de 2,5 milliards de paramètres, résout intelligemment le problème de seuil matériel des utilisateurs ordinaires. Avec seulement 9,9 Go de mémoire vidéo, il peut fonctionner en douceur sur la plupart des cartes graphiques grand public, réalisant vraiment la vision de "tout le monde peut être utilisé".
En termes d'innovation technologique, le modèle intègre trois encodeurs de texte pré-formés et introduit la technologie de normalisation QK pour améliorer la stabilité de la formation. Il convient de mentionner particulièrement que la conception du module à double attention dans ses 12 premières couches de transformation a considérablement amélioré le modèle en termes de qualité d'image, d'effet de mise en page et de compréhension complexe.
Le processus de formation du modèle combine des données synthétiques avec des données publiques sélectionnées et adopte une stratégie de formation hybride avec une amélioration progressive de la résolution, garantissant la diversité et la qualité des images générées. Par rapport à des modèles de taille moyenne similaires, il montre des avantages évidents dans l'effet de génération d'images et la vitesse de traitement.
Cependant, les utilisateurs doivent faire attention à certains détails lors de l'utilisation: des mots invites excessivement peuvent provoquer des défauts au bord de l'image; En même temps, il convient de noter qu'en raison des différences dans la distribution des données de formation, les mêmes mots rapides peuvent produire des effets créatifs différents.
La publication de ce modèle fournit non seulement des outils de création d'IA pratiques pour les créateurs individuels et les start-ups, mais reflète également la détermination de l'IA à la promotion de la popularisation de la technologie d'IA. Que ce soit utilisé pour la création artistique ou le développement de l'éducation, il apportera la possibilité d'une création d'IA à une base d'utilisateurs plus large.
Adresse de téléchargement du modèle: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
L'émergence de la diffusion stable 3.5 Medium marque le stade de la technologie de peinture de l'IA devenant plus populaire et plus facile à utiliser. Sa nature commerciale gratuite et ses faibles exigences matérielles ouvriront la porte à la création artistique de l'IA pour plus de personnes et promouvront l'application et le développement de la technologie d'IA dans divers domaines.