Disco -Diffusion
Eine Frankensteinsche Verschmelzung von Notizbüchern, Modellen und Techniken für die Generierung von KI -Kunst und -Animationen.
[Bald mit weiteren Informationen aktualisiert werden]
Beitragen
Dieses Projekt verwendet ein spezielles Conversion -Tool, um die Python -Dateien in Notizbücher umzuwandeln, um die Entwicklung zu vereinfachen.
Dies bedeutet, dass Sie das Notizbuch nicht direkt berühren müssen, um Änderungen daran vorzunehmen
Das verwendete Werkzeug heißt Colab-Convert
- Installieren Sie mit
pip install colab-convert
mit PIP - konvertieren .py in .ipynb
colab-convert /path/to/file.py /path/to/file.ipynb
- konvertieren .ipynb in .py
colab-convert /path/to/file.ipynb /path/to/file.py
Changelog
V1 Okt 29. 2021 - Sommnai
- Erste QOL -Verbesserungen hinzugefügt, einschließlich benutzerfreundlicher Benutzeroberfläche, Einstellungen+Eingeordneter Speichern und verbesserter Organisation von Google Drive -Ordner.
V1.1 13. November 2021 - Sommnai
- Enthält nun Größenoptionen, Intermediate -Speichern und feste Bildaufforderungen und Perlin -Inits. Nicht entlastete Stapeloption, da sie nicht funktioniert
V2 Update: 22. November 2021 - Sommnai
- Erste Zugabe von Katherine Crowsons Sekundärmodellmethode (https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi#scrollo=x5godnameeucr)
- Fix für fälschlicherweise benannte Einstellungsdateien beheben
V3 Update: 24. Dezember 2021 - Sommnai
- Implementierte die erweiterte Ausschnittsmethode von Dango
- Dank NeuralDivergent wurden Slip -Modelle hinzugefügt
- Das Problem mit NANS behoben, was zu schwarzen Bildern führt, mit massiven Hilfe und Tests von @softology
- Perlin ändert sich jetzt ordnungsgemäß in Chargen (ich bin mir nicht sicher, woher dieser Code von Perlin_regen stammt, aber danke)
V4 Update: Jan 2022 - Sommnai
- Implementiertes Diffusionszooming
- Chigozie Keyframing hinzugefügt
- Machte eine Reihe von Änderungen an Prozesse
v4.1 Update: 14. Januar 2022 - Sommnai
- Videoeingangsmodus hinzugefügt
- Lizenz hinzugefügt, die irgendwie vermisst wurde
- Eine verbesserte Eingabeaufforderungsschlüsselung, feste Image_Prompts und mehrere Eingabeaufforderungen fügte hinzugefügt
- Verbesserte Benutzeroberfläche
- Signifikant unter der Haubenreinigung und Verbesserung
- Verfeinerte Standardeinstellungen für jeden Modus
- Rutschmodelle vorerst auf Importkonflikte entfernt wurden
- Latent-Diffusion-Superres zum Schärfen hinzugefügt
- Der Lebenslauf -Run -Modus fügte hinzu
V5 Update: 20. Februar 2022 - Gandamu / Adam Letts
- 3D -Animationsmodus hinzugefügt. Verwendet gewichtete Kombination von Adabinen und Midas -Tiefenschätzungsmodellen. Verwendet Pytorch3D für 3D -Transformationen auf Colab und/oder Linux.
V5.1 Update: 30. März 2022 - Zippy / Chris Allen und Gandamu / Adam Letts
- Integrierte Turbo+Glatte Merkmale aus Disco -Diffusionsturbo - nur die Implementierung, ohne die Standardeinstellungen.
- Implementierter Lebenslauf von Turboanimationen so, dass es jetzt möglich ist, aus verschiedenen Batch -Ordnern und Stapelnummern wieder aufzunehmen.
- 3D -Rotationsparametereinheiten sind jetzt Grad (und nicht Radiant)
- Corryted Name Kollision in Sampledel_Mode (jetzt diffusion_sampling_mode für PLMS/DDIM und Sample_Mode für 3D -Transformationstichproben)
- Fügte die Option Video_init_seed_continuity hinzu, um Init -Videoanimationen kontinuierlicher zu gestalten
- Pytorch3d entfernt von einer Lite -Version, die speziell für die Disco -Diffusion zusammengestellt werden muss
- Super Auflösung entfernen
- Schlupfmodelle entfernen
- Update für CrossPlatform -Unterstützung
v5.1 Update: 4. April 2022 - MSFTSERVER AKA HostsServer
- Pytorch3d entfernt von einer Lite -Version, die speziell für die Disco -Diffusion zusammengestellt werden muss
- Super Auflösung entfernen
- Schlupfmodelle entfernen
- Update für CrossPlatform -Unterstützung
v5.2 Update: 10. April 2022 - Nin_Artificial / Tom Mason
v5.3 Update: 10. Juni 2022 - NShepperd, Huemin, cut_pow
- Horizontale und vertikale Symmetrie
- Zugabe von Vit-L/14@336PX-Modell (erfordert hohe VRAM)
v5.4 Update: 14. Juni 2022 - Devdef / Alex Spirin, in DD Main integriert von Gandamu / Adam Letts
- Warp -Modus - Für reibungslose/kontinuierliche Videoeingangsergebnisse, die die optische Durchflussschätzung und die Rahmenmischung nutzen
- Benutzerdefinierte Modelle unterstützen
v5.5 Update: 11. Juli 2022 - Palmweaver / Chris Scalf, Kaliyuga_ai, weitere Integration von Gandamu / Adam Letts
- OpenClip -Modelle Integration
- Pixel -Kunstdiffusions-, Aquarell -Diffusions- und Pulps -SciFi -Diffusionsmodelle
- Cut_ic_pow -Planung
v5.6 Update: 13. Juli 2022 - Felipe3Dartist, Integration von Gandamu / Adam Letts
- Integriertes Porträt_Generator_V001 - 512x512 Diffusionsmodell, das auf Gesichtern trainiert wurde - von Felipe3Dartist
v5.7 Update: 31. Dezember 2022 - Steffen Moelter (mit Minor Colab -Convert -Integration von Gandamu)
- Klon Midas V3 speziell. Dies behebt den 3D -Modus. Es war seit Midas V3.1 gebrochen worden, eine Inkompatibilität.
Notebook -Herkunft
Original Notebook von Katherine Crowson (https://github.com/crowsonkb, https://twitter.com/rivershavewings). Es verwendet entweder OpenAIs 256x256 bedingungslosen ImageNet oder Katherine Crowsons feinstimmigem 512x512-Diffusionsmodell (https://github.com/openai/guided-diffusion) zusammen mit Clip (https Textaufforderungen mit Bildern.
Modifiziert von Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss), um (hoffentlich) optimale Paramien für schnelle Generationen in 15-100 Timesteps anstelle von 1000 sowie räumlicheren Augmentationen einzubeziehen .
Weitere Verbesserungen gegenüber DANDO233 und NSHEPERD haben dazu beigetragen, die Qualität der Diffusion im Allgemeinen zu verbessern, insbesondere für kürzere Läufe wie dieses Notebook -Ziel.
Vark fügte Code hinzu, um mehrere Clip -Modelle gleichzeitig zu laden, gegen die alle Eingabeaufforderungen bewertet werden, was die Genauigkeit erheblich verbessern kann.
Die neuesten Funktionen von Zoom, Pan, Rotation und Keyframes wurden aus dem Vqgan Zoom -Notebook von Chigozie NRI (https://github.com/chigozienri, https://twitter.com/chigozienri) übernommen.
Die fortgeschrittene Dangocutn -Ausschnittsmethode stammt ebenfalls von DANGO223.
-
SOMNAI (https://twitter.com/somnai_dreams) fügte 2D -Diffusionsanimationstechniken, QOL -Verbesserungen und verschiedene Implementierungen von Technik und Techniken hinzu, die hauptsächlich im unten stehenden Changelog aufgeführt sind.
3D -Animationsimplementierung von Adam Letts (https://twitter.com/gandamu_ml) in Zusammenarbeit mit SOMNAI hinzugefügt.
Turbo -Funktion von Chris Allen (https://twitter.com/zippy731)
Verbesserungen an der Fähigkeit, auf lokalen Systemen, Windows -Support und Abhängigkeitsinstallation durch HostsServer auszuführen (https://twitter.com/hostsserver)
VR -Modus von Tom Mason (https://twitter.com/nin_artificial)
Horizontale und vertikale Symmetriefunktionalität durch NShepperd. Symmetry transformation_steps von huemin (https://twitter.com/huemin_art). Symmetrie -Integration in die Disco -Diffusion durch Dmitrii Tochilkin (https://twitter.com/cut_pow).
Warp und benutzerdefinierte Modellunterstützung von Alex Spirin (https://twitter.com/devdef).
Pixel -Kunstdiffusions-, Aquarell -Diffusions- und Pulp -Scifi -Diffusionsmodelle von Kaliyuga (https://twitter.com/Kaliyuga_ai). Folgen Sie Kaliyugas Twitter für die neuesten Modelle und für Notizbücher mit speziellen Einstellungen.
Integration von OpenClip -Modellen und Initiierung der Integration von Kaliyuga -Modellen durch Palmweaver/Chris Scalf (https://twitter.com/chrisscalf11)
Integrated Portrait_generator_v001 von Felipe3Dartist (https://twitter.com/felipe3Dartist)
Midas Version Tag Fix von Steffen Moelter (ein notwendiger Fix für den 3D -Animationsmodus, nachdem Midas v3.1 eingeführt wurde).