L'équipe d'Alibaba Cloud Tongyi Wanxiang a publié un nouveau modèle d'édition d'images ACE. Ce puissant outil d'IA peut générer et éditer des images grâce à des instructions vocales simples. Qu'il s'agisse de photographie stylisée, de production de storyboard ou de design d'intérieur, ACE peut facilement s'en charger, simplifiant considérablement le processus d'édition d'image. Sa principale innovation réside dans le module LCU (Long-context Condition Unit), qui prend en charge la saisie de conditions multimodales et construit un lien complet de construction de données d'édition et un lien de génération de jeu d'instructions pour garantir une haute précision et une haute qualité d'édition d'images. ACE prend non seulement en charge les images vincentiennes, mais dispose également de puissantes fonctions d'édition d'images, telles que l'édition visuelle contrôlable, la modification d'éléments, le redessinage de zones et l'édition en couches, qui sont comparables aux fonctions de Photoshop. Certaines fonctions ont été lancées sur l'application Tongyi.
Cette semaine, l'équipe d'Alibaba Cloud Tongyi Wanxiang a lancé un nouveau modèle d'édition d'images ACE, visant à fournir aux utilisateurs des services de génération et d'édition d'images plus pratiques et plus intelligents. Les utilisateurs peuvent générer ou modifier des images grâce à de simples instructions vocales, simplifiant considérablement la complexité de l'édition d'images. Cet outil prend en charge un large éventail de scénarios d'application, notamment les portraits stylisés, la production de storyboards, la décoration intérieure, etc.
Le modèle ACE prend non seulement en charge les images de génération de texte (Vincent Pictures), mais dispose également de puissantes fonctions d'édition d'images. Les utilisateurs peuvent effectuer des tâches telles que l'édition visuelle contrôlable, la modification d'éléments, le redessinage de zones et l'édition hiérarchique via le dialogue.
Par exemple, il suffit aux utilisateurs de saisir des commandes telles que « modifier l'arrière-plan de la photo d'identité » ou « supprimer le filigrane en un clic » pour mettre en œuvre facilement des fonctions similaires à Photoshop. Il convient de noter que la fonction de stylisation partielle d'ACE a été lancée sur l'application Tongyi, améliorant encore l'expérience utilisateur.
Selon l'introduction officielle, l'innovation principale du modèle ACE réside dans son module unique LCU (Long-Context Condition Unit). LCU peut prendre en charge l'entrée conditionnelle multimodale pour répondre aux besoins de diverses tâches d'édition générales, et a construit un lien complet de construction de données d'édition et un lien de génération de jeu d'instructions pour garantir la précision et la haute qualité des effets d'édition d'image.
Le lancement d'ACE rend non seulement l'IA plus largement utilisée dans le domaine de l'édition d'images, mais fournit également un support open source aux développeurs mondiaux, marquant une nouvelle avancée pour Alibaba Cloud dans le domaine de la technologie de traitement d'image intelligent. Ce nouvel outil améliorera considérablement l'efficacité et la commodité du traitement des images, offrant aux utilisateurs une expérience d'édition plus créative et personnalisée.
Adresse open source :
https://github.com/ali-vilab/ACE
Adresse de l'expérience :
https://huggingface.co/spaces/scepter-studio/ACE-Chat
Communauté magique :
https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
L'open source et l'accès libre du modèle ACE favoriseront le développement et l'application ultérieurs de la technologie d'édition d'images IA et apporteront de la commodité à un plus grand nombre de développeurs et d'utilisateurs. Nous attendons avec impatience qu’ACE apporte des fonctions et des scénarios d’application plus surprenants à l’avenir.