diffusers Download - diffusers Quellcode Download

diffusers

Anderer Quellcode

v0.31.0

Herunterladen

? Diffusoren sind die Anlaufstelle für hochmoderne vorbereitete Diffusionsmodelle zum Erzeugen von Bildern, Audio und sogar 3D-Strukturen von Molekülen. Egal, ob Sie nach einer einfachen Inferenzlösung suchen oder Ihre eigenen Diffusionsmodelle trainieren? Diffusers ist eine modulare Toolbox, die beides unterstützt. Unsere Bibliothek konzentriert sich auf die Benutzerfreundlichkeit über Leistung, einfach über einfach und die Anpassbarkeit gegenüber Abstraktionen.

? Diffusorers bietet drei Kernkomponenten an:

Hochmoderne Diffusionspipelines, die in Folge mit nur wenigen Codezeilen ausgeführt werden können.
Austauschbare Geräuschplaner für verschiedene Diffusionsgeschwindigkeiten und Ausgangsqualität.
Vorbereitete Modelle, die als Bausteine verwendet werden können und mit Schedulern kombiniert werden, um Ihre eigenen End-to-End-Diffusionssysteme zu erstellen.

Installation

Wir empfehlen die Installation? Diffusoren in einer virtuellen Umgebung von PYPI oder Conda. Weitere Informationen zur Installation von Pytorch und Flachs finden Sie in der offiziellen Dokumentation.

Pytorch

Mit pip (offizielles Paket):

pip install --upgrade diffusers[torch]

Mit conda (von der Gemeinschaft gepflegt):

conda install -c conda-forge diffusers

Flachs

Mit pip (offizielles Paket):

pip install --upgrade diffusers[flax]

Apple Silicon (M1/M2) -Intenunterstützung

Weitere Informationen finden Sie in der Verwendung einer stabilen Diffusion im Apple Silicon Guide.

QuickStart

Ausgänge erzeugen ist super einfach mit? Diffusoren. Um ein Bild aus dem Text zu generieren, verwenden Sie die von der from_pretrained Methode, um ein vorgezogenes Diffusionsmodell zu laden (durchsuchen Sie den Hub für mehr als 30.000 Kontrollpunkte):

 from diffusers import DiffusionPipeline
import torch

pipeline = DiffusionPipeline . from_pretrained ( "stable-diffusion-v1-5/stable-diffusion-v1-5" , torch_dtype = torch . float16 )
pipeline . to ( "cuda" )
pipeline ( "An image of a squirrel in Picasso style" ). images [ 0 ]

Sie können auch in die Modelle und Schedulers Toolbox eintauchen, um Ihr eigenes Diffusionssystem zu erstellen:

 from diffusers import DDPMScheduler , UNet2DModel
from PIL import Image
import torch

scheduler = DDPMScheduler . from_pretrained ( "google/ddpm-cat-256" )
model = UNet2DModel . from_pretrained ( "google/ddpm-cat-256" ). to ( "cuda" )
scheduler . set_timesteps ( 50 )

sample_size = model . config . sample_size
noise = torch . randn (( 1 , 3 , sample_size , sample_size ), device = "cuda" )
input = noise

for t in scheduler . timesteps :
    with torch . no_grad ():
        noisy_residual = model ( input , t ). sample
        prev_noisy_sample = scheduler . step ( noisy_residual , t , input ). prev_sample
        input = prev_noisy_sample

image = ( input / 2 + 0.5 ). clamp ( 0 , 1 )
image = image . cpu (). permute ( 0 , 2 , 3 , 1 ). numpy ()[ 0 ]
image = Image . fromarray (( image * 255 ). round (). astype ( "uint8" ))
image

Schauen Sie sich den QuickStart an, um Ihre Diffusionsreise noch heute zu starten!

So navigieren Sie durch die Dokumentation

Dokumentation	Was kann ich lernen?
Tutorial	Ein grundlegender Crash -Kurs zum Erlernen, wie die wichtigsten Funktionen der Bibliothek wie Modelle und Scheduler verwendet werden, um Ihr eigenes Diffusionssystem zu erstellen und Ihr eigenes Diffusionsmodell zu trainieren.
Laden	Anleitungen zum Laden und Konfigurieren aller Komponenten (Pipelines, Modelle und Scheduler) der Bibliothek sowie der Verwendung verschiedener Scheduler.
Pipelines für Inferenz	Anleitungen zur Verwendung von Pipelines für unterschiedliche Inferenzaufgaben, die Erzeugung, steuern erzeugte Ausgänge und Zufälligkeit und wie eine Pipeline in die Bibliothek beiträgt.
Optimierung	Anleitungen, wie Sie Ihr Diffusionsmodell optimieren, um schneller zu laufen und weniger Speicher zu verbrauchen.
Ausbildung	Anleitungen zum Training eines Diffusionsmodells für verschiedene Aufgaben mit unterschiedlichen Trainingstechniken.

Beitrag

Wir sind Beiträge der Open-Source-Community! Wenn Sie zu dieser Bibliothek beitragen möchten, lesen Sie bitte unseren Beitragsleitfaden. Sie können nach Problemen achten, die Sie angehen möchten, um zur Bibliothek beizutragen.

Sehen Sie gute erste Themen für allgemeine Möglichkeiten, um einen Beitrag zu leisten
Siehe neues Modell / Pipeline, um aufregende neue Diffusionsmodelle / Diffusionspipelines beizutragen
Siehe New Scheduler

Sagen Sie auch in unserem öffentlichen Discord -Kanal. Wir diskutieren die heißesten Trends über Diffusionsmodelle, helfen sich gegenseitig bei Beiträgen, persönlichen Projekten oder hängen einfach nur ☕ ab.

Beliebte Aufgaben und Pipelines

Aufgabe	Pipeline	? Nabe
Bedingungslose Bildgenerierung	Ddpm	Google/DDPM-EMA-Church-256
Text-to-Image	Stabiler Diffusionstext-zu-Image	stabiler Diffusion-V1-5/Stabil-Diffusion-V1-5
Text-to-Image	ausschütten	Kakaobrain/Karlo-V1-Alpha
Text-to-Image	Deepfloyd wenn	Deepfloyd/if-i-xl-v1.0
Text-to-Image	Kandinsky	Kandinsky-Community/Kandinsky-2-2-Decoder
Textgesteuerter Bild-zu-Image	ControlNet	lllyasviel/sd-controlnet-canny
Textgesteuerter Bild-zu-Image	InstructPix2Pix	Timbrooks/Instruct-Pix2Pix
Textgesteuerter Bild-zu-Image	Stabiles Diffusionsbild-zu-Image	stabiler Diffusion-V1-5/Stabil-Diffusion-V1-5
Textgesteuerte Bildinstrengung	Stabile Diffusions -Inpainting	Runwayml/Stable-Diffusion-Inpainting
Bildvariation	Stabile Diffusionsbildvariation	Lambdalabs/SD-Image-Variationen-Diffuser
Superauflösung	Stabile Diffusion gehoben	Stabilityai/Stable-Diffusion-X4-Upscaler
Superauflösung	Stabile diffusion latent gehoben	Stabilityai/SD-X2-Latent-Upscaler

Beliebte Bibliotheken verwenden? Diffusoren

https://github.com/microsoft/taskmatrix
https://github.com/invoke-ai/invokeaii
https://github.com/instantid/instantid
https://github.com/apple/ml-stable-diffusion
https://github.com/sanster/lama-cleaner
https://github.com/idea-research/grounded-segment-anything
https://github.com/ashawkey/stable-dreamfusion
https://github.com/deep-floyd/if
https://github.com/bentoml/bentoml
https://github.com/bmalais/kohya_ss
+14.000 andere erstaunliche Github -Repositories?

Vielen Dank, dass Sie uns verwendet haben.

Credits

Diese Bibliothek konkretisiert frühere Arbeiten vieler verschiedener Autoren und wäre ohne ihre großartigen Forschung und Implementierungen nicht möglich gewesen. Insbesondere die folgenden Implementierungen, die uns bei unserer Entwicklung geholfen haben und ohne die die API heute nicht so poliert werden konnte:

@Compvis 'latente Diffusionsmodelle Bibliothek, hier verfügbar
@Hojonathanho Original DDPM -Implementierung, hier verfügbar sowie die äußerst nützliche Übersetzung in Pytorch von @Pesser, erhältlich hier
@Ermongroups DDIM -Implementierung, hier verfügbar
@Yang-Songs Score-Ve- und Score-VP-Implementierungen, die hier verfügbar sind

Wir möchten uns auch bei @heejkoo für den sehr hilfreichen Überblick über Papiere, Code und Ressourcen für Diffusionsmodelle bedanken, die hier verfügbar sind, sowie @crowsonkb und @Rromb für nützliche Diskussionen und Erkenntnisse.

Zitat

 @misc { von-platen-etal-2022-diffusers ,
  author = { Patrick von Platen and Suraj Patil and Anton Lozhkov and Pedro Cuenca and Nathan Lambert and Kashif Rasul and Mishig Davaadorj and Dhruv Nair and Sayak Paul and William Berman and Yiyi Xu and Steven Liu and Thomas Wolf } ,
  title = { Diffusers: State-of-the-art diffusion models } ,
  year = { 2022 } ,
  publisher = { GitHub } ,
  journal = { GitHub repository } ,
  howpublished = { url{https://github.com/huggingface/diffusers} }
}