Kuaishou a récemment publié une percée technologique majeure, ouvrant officiellement son modèle de génération d'images développé indépendamment - "Kotu Kolors". Ce modèle représente non seulement l'accumulation profonde de Kuaishou dans le domaine de l'intelligence artificielle, mais démontre également sa force innovante dans la technologie de génération d'images. La sortie de Kotu Kolors marque une autre percée importante pour Kuaishou dans l'application de la technologie de l'IA, en particulier dans le domaine de la génération et du traitement d'images, offrant aux créateurs un puissant support d'outils.
L'avantage principal de Kolos est sa forte compréhension du langage et les capacités de génération d'images. Ce modèle utilise le modèle de langue générale (GLM) comme codeur de texte, prend en charge les mots rapides bilingues chinois et anglais et peut gérer des contextes de 256 jetons maximums. Cela signifie que les utilisateurs peuvent générer des images fortement conformes aux attentes grâce à des descriptions de texte détaillées, qu'il s'agisse de conception de scène complexe ou d'expression émotionnelle délicate, elle peut être réalisée via ce modèle.
En termes de données de formation, Kolors s'entraîne profondément sur la base de milliards d'images de texte, ce qui donne au modèle une base de connaissances riche et permet la génération d'images diverses et précises. Il convient particulièrement de mentionner que le modèle a été optimisé pour les éléments culturels chinois.
De plus, Kotokolors a particulièrement bien performé dans la génération de textes chinois. Il peut non seulement comprendre les mots rapides chinois, mais aussi intégrer du texte chinois dans les images générées, ajoutant plus de puissance expressive à l'image. Cela a été entièrement vérifié dans les tests réels.
Dans les applications pratiques, Koto Kolors démontre sa puissante capacité de génération. Par exemple, lors de la génération d'images sur le thème du "chaton plat allongé", le modèle peut parfaitement présenter les exigences des mots rapides chinois, et le texte de l'image est clair et précis. Cependant, lorsque vous utilisez des mots rapides en anglais, les performances du modèle sont légèrement insuffisantes et elle est sujette à des mots ou des fautes de frappe manquantes. Cela montre que bien que Kolos fonctionne bien dans le traitement chinois, il y a encore place à l'amélioration de la génération anglaise.
Derrière Kolors se trouve le puissant soutien technique de Kuaishou. Le modèle est basé sur l'architecture SDXL et intègre la technologie ChatGLM256, améliorant davantage ses capacités de compréhension bilingue et de génération de texte. Cependant, il convient de noter que l'exécution de ce modèle nécessite une grande mémoire vidéo, environ 19 Go, ce qui exprime des exigences élevées sur les appareils matériels et peut limiter l'utilisation de certains utilisateurs.
L'open source de Kolors de Kuaishou cette fois n'est pas seulement une contribution à la communauté technologique, mais aussi une promotion audacieuse de la liberté de création. Grâce à l'open source, Kuaishou espère que davantage de développeurs, de concepteurs et d'artistes peuvent utiliser cet outil pour explorer les possibilités infinies de l'IA dans la création artistique. Dans le même temps, cela démontre également la détermination et la force de Kuaishou dans le domaine de la technologie de l'IA, indiquant que des technologies plus innovantes seront appliquées à des scénarios réels à l'avenir.
Le plan open source de Koto Kolors comprend également la prise en charge CN (ControlNet), LORA (adaptation de faible rang), IPA (adaptation de l'invite d'image) et le support direct Comfyui. processus.
En général, la sortie de Kotu Kolors n'est pas seulement une percée importante pour Kuaishou dans le domaine de la technologie de l'IA, mais aussi une innovation dans la technologie de génération d'images. Grâce à ses puissantes capacités de compréhension du langage et de génération d'images, il offre aux utilisateurs de nouveaux outils créatifs et ouvre également un nouveau chemin pour l'application de la technologie de l'IA dans la création artistique.
Site officiel de Ketu: https://top.aibase.com/tool/kuaishoukeddamoxingkolors
Adresse du projet: https://top.aibase.com/tool/kolors