Le grand modèle Hunyuan DiT (HunyuanDiT) de Tencent continue d'être mis à jour de manière itérative, offrant aux utilisateurs des capacités de génération d'images plus puissantes. L'éditeur de Downcodes a appris que HunyuanDiT et la communauté ont récemment publié trois nouveaux plug-ins contrôlables, ControlNet, à savoir Tile (amplification haute définition), Inpainting (réparation et expansion d'image) et Lineart (dessin au trait), ce qui améliore considérablement les performances du modèle. . Gamme d'applications et liberté de création. L'ajout de ces plug-ins permet à Hunyuan DiT de montrer un potentiel d'application plus fort dans les domaines de l'art, de la créativité, de l'architecture et d'autres domaines, en fournissant des services de génération d'images plus précis et plus pratiques aux développeurs et créateurs du monde entier.
Le grand modèle HunyuanDiT (HunyuanDiT) de Tencent s'est récemment associé à la communauté pour lancer trois nouveaux plug-ins contrôlables, ControlNet, à savoir Tile (amplification haute définition), Inpainting (réparation et expansion d'image) et Lineart (dessin au trait), pour étendre davantage Sa matrice ControlNet. L'ajout de ces plug-ins permet au modèle Hunyuan DiT de couvrir un plus large éventail de scénarios d'application, y compris 80 % de cas et de scénarios tels que l'art, la créativité, l'architecture, la photographie, la beauté et le commerce électronique, offrant ainsi aux entreprises mondiales et aux développeurs individuels et les créateurs offrent une génération d'images plus précises et une plus grande liberté de création.
Le plug-in Tile peut étendre les informations de l'image et obtenir une amplification ultra-claire, atteignant même une résolution de 4K à 8K, ce qui convient aux scènes qui nécessitent la recherche ultime des détails de l'image. Le plug-in Inpainting peut remplir les parties tachées et marbrées de l'image selon les besoins du créateur, obtenir des effets tels que le remplacement de l'arrière-plan et le changement de sujet des personnages, et gérer le redessinage de l'image sur une grande surface. Le plug-in Lineart utilise différents types de lignes pour créer des images réelles, d'animation et architecturales, et convient à la génération de rendus architecturaux et à la coloration de manuscrits.
En outre, Tencent Hunyuan DiT a déjà publié des modèles ControlNet avec des conditions astucieuses (bord), profondeur (profondeur), pose (posture humaine) et d'autres conditions pour aider les développeurs à raisonner, et a ouvert le programme de formation ControlNet pour permettre aux développeurs et aux créateurs de Possibilité de former des modèles ControlNet personnalisés.
Depuis l'annonce d'une mise à niveau complète et de l'open source en mai, Hunyuan DiT, en tant que premier modèle de génération de graphiques open source à architecture DiT native chinoise du secteur, a continué à construire un écosystème de développeurs et a publié une bibliothèque d'accélération exclusive pour améliorer l'efficacité du raisonnement et raccourcir la génération de graphiques. temps. Et ouvrez davantage le code d’inférence. En juillet, Hunyuan DiT a été mis à niveau vers la version 1.2 et une petite version de mémoire vidéo a été open source. Elle ne nécessite que 6 Go de mémoire vidéo pour fonctionner, ce qui la rend plus conviviale pour les développeurs déployés localement sur des ordinateurs personnels.
Actuellement, Hunyuan DiT compte plus de 3,1 000 étoiles sur Github, ce qui en fait le modèle open source DiT national le plus populaire.
Site officiel
https://dit.hunyuan.tencent.com/
code
https://github.com/Tencent/HunyuanDiT
Modèle
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
papier
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Dans l'ensemble, les mises à jour continues et la stratégie open source de Tencent Hunyuan DiT fournissent aux développeurs et aux créateurs des outils et des ressources puissants, et favorisent le progrès et le développement de la technologie Wenshengtu. Il vaut la peine d'attendre avec impatience davantage d'innovations et de percées à l'avenir.