Der Herausgeber von Downcodes erfuhr, dass Stability AI sein neuestes und leistungsstärkstes Bilderzeugungsmodell, Stable Diffusion 3.5, veröffentlicht hat. Dieses Modell ist keine einzelne Version, sondern enthält drei Versionen, um den Anforderungen verschiedener Benutzer gerecht zu werden, von wissenschaftlichen Forschern bis hin zu Unternehmensbenutzern. kann davon profitieren. Diese drei Versionen legen unterschiedliche Schwerpunkte auf Parametermenge, Laufgeschwindigkeit und anwendbare Hardware und bieten Benutzern eine größere Auswahl.
Gestern Abend hat Stability AI sein leistungsstärkstes Modell veröffentlicht – Stable Diffusion 3.5. Dabei handelt es sich nicht nur um ein einzelnes Modell, sondern um einen Familien-Bucket mit drei Versionen, der alle Anforderungen erfüllen soll, vom wissenschaftlichen Forscher bis zum Geschäftsbegeisterten.
Die drei Versionen sind Stable Diffusion3.5Large, Stable Diffusion3.5Large Turbo und Stable Diffusion3.5Medium, die am 29. Oktober veröffentlicht werden.
Stable Diffusion3.5Large ist ein 8-Milliarden-Parameter-Basismodell, das für seine hervorragende Bildqualität und Stichwortgenauigkeit bekannt ist. Damit ist es ideal für den professionellen Einsatz und in der Lage, Bilder mit einer Auflösung von bis zu 1 Megapixel zu erzeugen.
Stable Diffusion3.5Large Turbo ist eine destillierte Version des ersteren, die in nur 4 Schritten qualitativ hochwertige Bilder erzeugen kann, viel schneller als Stable Diffusion3.5Large.
Stable Diffusion3.5Medium verfügt über 2,5 Milliarden Parameter, nutzt eine verbesserte MMDiT-X-Architektur und Trainingsmethode, ist Plug-and-Play-fähig, kann direkt auf Consumer-Hardware ausgeführt werden, gleicht Bildqualität und Anpassbarkeit aus und kann hochauflösende Bilder erzeugen mit Raten zwischen 0,25 und 2 Megapixeln.
Bei der Entwicklung dieser Modelle stand die Anpassbarkeit im Vordergrund, indem die Abfrageschlüsselnormalisierung in den Transformatorblock integriert wurde, der Modelltrainingsprozess stabilisiert und die weitere Feinabstimmung und Entwicklung vereinfacht wurde. Um die Flexibilität bei nachgelagerten Aufgaben zu unterstützen, behält Stability AI eine breitere Wissensbasis und verschiedene Stile im Modell bei, obwohl dies zu erhöhter Unsicherheit bei den Ausgabeergebnissen führen kann.
Das Stable Diffusion3.5-Modell zeichnet sich in mehreren Aspekten aus, darunter Anpassbarkeit, effiziente Leistung und vielfältige Ausgabe. Diese Modelle können leicht an spezifische Autorenanforderungen angepasst oder Anwendungen basierend auf benutzerdefinierten Arbeitsabläufen erstellt werden. Sie sind außerdem für den Betrieb auf Standard-Hardware für Endverbraucher ohne übermäßige Hardwareanforderungen optimiert. Darüber hinaus sind diese Modelle in der Lage, Bilder zu erstellen, die die ganze Welt darstellen, ohne dass umfangreiche Eingabeaufforderungen erforderlich sind, und sind gleichzeitig in der Lage, Bilder in einer Vielzahl von Stilen und Ästhetiken wie 3D, Fotografie, Malerei, Strichzeichnungen und praktisch jedem visuellen Element zu erzeugen Stil, den man sich vorstellen kann.
Stability AI betonte außerdem sein Engagement für Sicherheit, indem es angemessene Schritte unternahm, um den Missbrauch von Stable Diffusion 3.5 zu verhindern, und sich bereits in den frühen Entwicklungsstadien auf Integrität konzentrierte. Darüber hinaus ist die Stability AI-Community-Lizenz sehr freizügig und ermöglicht Einzelpersonen und Organisationen die kostenlose Nutzung des Modells für nichtkommerzielle Zwecke, einschließlich wissenschaftlicher Forschung. Das Modell ist auch für die kommerzielle Nutzung durch Start-ups, KMU und Kreative mit einem Jahresumsatz von bis zu 1 Million US-Dollar kostenlos. Das Eigentum an den resultierenden Medien bleibt von restriktiven Lizenzen unberührt.
Das Stable Diffusion3.5-Modell ist bereits zum Selbsthosten auf Hugging Face verfügbar, und der Inferenzcode wurde ebenfalls als Open Source bereitgestellt. Darüber hinaus kann über Plattformen wie Stability AI API, Replicate, ComfyUI und DeepInfra auf das Modell zugegriffen werden.
Erfahrungsadresse: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
Alles in allem haben die Modelle der Stable Diffusion 3.5-Serie erhebliche Fortschritte in Bezug auf Bildqualität, Generierungsgeschwindigkeit und Benutzerfreundlichkeit gemacht und bieten Benutzern leistungsstarke Bildgenerierungsfunktionen und flexible Anwendungsszenarien. Der Herausgeber von Downcodes empfiehlt allen Lesern, es zu erleben und seine leistungsstarke Leistung zu spüren.