Das Noah's Ark Laboratory von Huawei hat das neueste Bilderzeugungsmodell PixArt-Σ veröffentlicht, ein KI-Modell, das hochauflösende 4K-Bilder erzeugen kann. Es übernimmt das innovative DiT-Framework und die schwache bis starke Trainingsmethode, kombiniert mit hochwertigen Datensätzen und effizienter Token-Komprimierungstechnologie. Dieser Schritt reduziert die Schulungskosten und Modellparameteranforderungen für die 4K-Bilderzeugung erheblich, stellt wertvolle Ressourcen für einzelne Forscher und kleine Teams bereit, fördert die Entwicklung des AIGC-Bereichs erheblich und gleicht die Schwierigkeiten aus, mit denen einzelne Forscher aufgrund von Ressourcenbeschränkungen konfrontiert sind Die Nachteile der hochauflösenden Bilderzeugung gehören der Vergangenheit an.
Huawei Noah hat ein Bildgenerierungsmodell namens PixArt-Σ veröffentlicht, das die Generierung von Bildern mit 4K-Auflösung unterstützt. Unter Verwendung des DiT-Frameworks, einer schwachen bis starken Trainingsmethode, der Integration hochwertiger Trainingsdatensätze und einer effizienten Token-Komprimierungstechnologie kann PixArt-Σ hochwertige Bilder mit 4K-Auflösung mit geringeren Trainingskosten und Modellparametern erzeugen und diese ausfüllen füllt die Lücke begrenzter Ressourcen für einzelne Forscher und fördert Innovationen in der AIGC-Community.
Das Aufkommen von PixArt-Σ markiert die Senkung der Schwelle für hochauflösende Bilderzeugungstechnologie und bietet mehr Einzelpersonen und Teams die Möglichkeit, an der AIGC-Forschung teilzunehmen. Es wird angenommen, dass in Zukunft weitere innovative Anwendungen auf Basis von PixArt-Σ erscheinen werden , was das Ökosystem von AIGC weiter bereichert.