Das Hunyuan DiT-Großmodell (HunyuanDiT) von Tencent wird weiterhin iterativ aktualisiert und bietet Benutzern leistungsfähigere Bildgenerierungsfunktionen. Der Herausgeber von Downcodes erfuhr, dass HunyuanDiT und die Community kürzlich drei neue steuerbare Plug-Ins, ControlNet, veröffentlicht haben, nämlich Tile (High-Definition-Verstärkung), Inpainting (Bildreparatur und -erweiterung) und Lineart (Strichzeichnung), was die Leistung des Modells erheblich verbessert . Vielfältige Einsatzmöglichkeiten und gestalterische Freiheit. Durch die Hinzufügung dieser Plug-ins kann Hunyuan DiT ein stärkeres Anwendungspotenzial in den Bereichen Kunst, Kreativität, Architektur und anderen Bereichen zeigen und Entwicklern und Kreativen auf der ganzen Welt genauere und bequemere Bildgenerierungsdienste bieten.
Das HunyuanDiT-Großmodell (HunyuanDiT) von Tencent hat sich kürzlich mit der Community zusammengetan, um drei neue steuerbare Plug-Ins, ControlNet, zu veröffentlichen, nämlich Tile (High-Definition-Verstärkung), Inpainting (Bildreparatur und -erweiterung) und Lineart (Strichzeichnung), um es weiter zu erweitern Seine ControlNet-Matrix. Durch die Hinzufügung dieser Plug-ins kann das Hunyuan DiT-Modell ein breiteres Spektrum an Anwendungsszenarien abdecken, darunter 80 % der Fälle und Szenarien wie Kunst, Kreativität, Architektur, Fotografie, Schönheit und E-Commerce, und bietet globale Unternehmen und einzelne Entwickler und Kreativen bietet eine genauere Bilderzeugung und größere kreative Freiheit.
Das Tile-Plug-in kann die Informationen für das Bild erweitern und eine ultraklare Verstärkung erzielen und sogar eine Auflösung von 4K bis 8K erreichen, was für Szenen geeignet ist, die das ultimative Streben nach Bilddetails erfordern. Das Inpainting-Plug-in kann die verschmierten und fleckigen Teile des Bildes entsprechend den Anforderungen des Erstellers ausfüllen, Effekte wie Hintergrundersetzung und Zeichensubjektwechsel erzielen und das Neuzeichnen großflächiger Bilder durchführen. Das Lineart-Plug-in verwendet verschiedene Linientypen zur Erstellung realer, animierter und architektonischer Bilder und eignet sich zur Erstellung von Architekturdarstellungen und Farbmanuskripten.
Darüber hinaus hat Tencent Hunyuan DiT zuvor ControlNet-Modelle mit Canny (Kante), Tiefe (Tiefe), Pose (menschliche Haltung) und anderen Bedingungen veröffentlicht, um Entwickler beim Denken zu unterstützen, und hat das ControlNet-Schulungsprogramm als Open-Source-Lösung bereitgestellt, um Entwicklern und Entwicklern dies zu ermöglichen Möglichkeit, benutzerdefinierte ControlNet-Modelle zu trainieren.
Seit der Ankündigung eines umfassenden Upgrades und Open Source im Mai hat Hunyuan DiT als branchenweit erstes Open-Source-Diagrammgenerierungsmodell mit DiT-Architektur mit chinesischer Muttersprache den Aufbau eines Entwicklerökosystems fortgesetzt und eine exklusive Beschleunigungsbibliothek veröffentlicht, um die Argumentationseffizienz zu verbessern und die Diagrammgenerierung zu verkürzen Zeit. Und weiter Open Source des Inferenzcodes. Im Juli wurde Hunyuan DiT auf Version 1.2 aktualisiert und eine kleine Videospeicherversion wurde als Open-Source-Version bereitgestellt. Für die Ausführung sind nur 6 GB Videospeicher erforderlich, wodurch es für Entwickler, die lokal auf PCs bereitgestellt werden, benutzerfreundlicher ist.
Derzeit hat Hunyuan DiT mehr als 3,1.000 Sterne auf Github und ist damit das beliebteste inländische DiT-Open-Source-Modell.
Offizielle Website
https://dit.hunyuan.tencent.com/
Code
https://github.com/Tencent/HunyuanDiT
Modell
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
Papier
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Alles in allem stellen die kontinuierlichen Updates und die Open-Source-Strategie von Tencent Hunyuan DiT Entwicklern und Entwicklern leistungsstarke Tools und Ressourcen zur Verfügung und fördern den Fortschritt und die Entwicklung der Wenshengtu-Technologie. Es lohnt sich, sich auf weitere Innovationen und Durchbrüche in der Zukunft zu freuen.