Stability AI veröffentlicht ein neues Modell der stabilen Diffusion 3.5 -Generation, drei Versionen und eine große Geschwindigkeitsverbesserung - AI -Artikel - Artikel

Autor：Eve Cole Aktualisierungszeit：2025-02-12 15:00:03

Stability AI kündigt den Start von Stable Diffusion 3.5 an, einer Reihe von drei verschiedenen Versionen von Modellen mit großer Text-zu-Image-Erzeugung. Die Serie zielt darauf ab, die breite Palette von Bedürfnissen von Forschern an Unternehmenskunden bis hin zu Enthusiasten zu erfüllen, indem sie Modelle unterschiedlicher Parameterskalen und Leistungsmerkmale für unterschiedliche Computerfunktionen und Anwendungsszenarien bereitstellen. Das Update soll auf frühere Mängel stabiler Diffusion 3.0 reagieren und mit anderen führenden Tools zur Erzeugung von KI -Bildgenehmigungen auf dem Markt konkurrieren.

Stability AI hat kürzlich ihr neuestes Deep Learning Text-to-Image-Generation-Modell der Stabilen Diffusion3.5 gestartet. Diese Veröffentlichung umfasst drei verbesserte Open -Source -Modelle, die den Anforderungen verschiedener Benutzer entsprechen, darunter Forscher, Unternehmenskunden und Enthusiasten.

Unter ihnen ist stabiler Diffusion 3.5Large das leistungsstärkste Modell in der gesamten Serie mit Parametern von bis zu 8,1 Milliarden. Mit seiner hervorragenden Bildqualität und hohen Reaktionsfähigkeit auf Eingabeaufforderungen ist das Modell ideal für professionelle Benutzer, die hochwertige Bilder mit einer Auflösung von bis zu 1 Megapixel erzeugen können.

Darüber hinaus ist stabiler Diffusion 3.5Large Turbo eine vereinfachte Version von stabilem Diffusion3.5Large. Das Erzeugen von hochwertigen Bildern verbessert die Geschwindigkeit erheblich.

Ein weiteres neues Modell ist das stabile Diffusion 3.5Medium, das 2,5 Milliarden Parameter enthält. Das Modell verwendet eine verbesserte MMDIT-X-Architektur- und Trainingsmethode, die als "aus der Schachtel" ausgelegt ist und auch auf Verbraucherhardware reibungslos ausgeführt wird. Es schafft eine gute Balance zwischen der Qualität der Bildgenerierung und der einfachen Anpassung und erzeugt 0,25 bis 2 Megapixelbilder.

Der Hintergrund dieser Veröffentlichung ist, dass Stability AI nach der Veröffentlichung von Stable Diffusion3Medium nach der Veröffentlichung von stabilem Diffusion3Medium eine transformativere Lösung entschied. Das Unternehmen hofft, die Wettbewerbsfähigkeit des Marktes mit dem Update zurückzugewinnen, um Herausforderungen von Plattformen wie Dall-E und Midjourney von Openai zu erfüllen.

Eine wichtige technologische Innovation im neuen Modell ist die Einführung der Normalisierungstechnologie für Abfrageschlüssel. Diese Innovation verbessert die Anpassung des Modells und die Reaktionsfähigkeit auf Eingabeaufforderungen, und Benutzer können konsistentere Ergebnisse mit klaren Eingabeaufforderungen erzielen und gleichzeitig eine umfassendere Bildinterpretation erhalten, wenn Sie breitere Eingabeaufforderungen verwenden.

Das Modell der stabilen Diffusion3.5-Serie wird unter Stability AI Community-Lizenz veröffentlicht, sodass Benutzer nicht kommerziell kostenlos verwenden können. Gleichzeitig können Unternehmen mit einem Jahreseinkommen von weniger als 1 Million US -Dollar kostenlos für die kommerzielle Nutzung verwendet werden, während Benutzer mit überschüssigem Einkommen eine Unternehmenslizenz beantragen müssen.

Alle Modelle und ihre Selbsthost-Gewichte werden auf der APIs von Face and Stability AI zur Verfügung gestellt. Darüber hinaus wird die Funktion ControlNets, die erweiterte Bildanpassungsoptionen bietet, in den kommenden Tagen voraussichtlich gestartet werden.

Offizieller Eingang:

https://stability.ai/stable-image

Drei Versionen von umarmenden Gesichtsportalen:

https://huggingface.co/stabilityai/stable-diffusion-3.5-large

https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

Schlüsselpunkte:

Das neu gestaltete stabile Diffusion3.5 bietet drei Modellversionen, um unterschiedliche Benutzeranforderungen zu erfüllen.

Stabile Diffusion3.5Large Turbo hat schnellere Geschwindigkeiten der Bilderzeugung, die für die schnelle Erstellung geeignet sind.

Das neue Modell führt die Normalisierungstechnologie der Abfrageschlüssel ein, die die Anpassung und Reaktionsfähigkeit verbessert.

Kurz gesagt, der Start des Modells der Stabilitätsdiffusion 3.5 ist ein großes Upgrade der Stabilitäts-KI im Bereich der Erzeugung von Text-zu-Image-Erzeugung. im heftigen Marktwettbewerb. Besuchen Sie die bereitgestellten Links und erleben Sie die brandneue Image -Generationstechnologie!