ดาวน์โหลด diffusers - ดาวน์โหลดซอร์สโค้ด diffusers

diffusers

ซอร์สโค้ดอื่น ๆ

v0.31.0

ดาวน์โหลด

- Diffusers เป็นห้องสมุดไปสู่สำหรับแบบจำลองการแพร่กระจายที่ทันสมัยสำหรับการสร้างภาพเสียงและแม้กระทั่งโครงสร้าง 3 มิติของโมเลกุล ไม่ว่าคุณจะกำลังมองหาวิธีแก้ปัญหาการอนุมานที่เรียบง่ายหรือฝึกอบรมแบบจำลองการแพร่ของคุณเอง? Diffusers เป็นกล่องเครื่องมือแบบแยกส่วนที่รองรับทั้งสอง ห้องสมุดของเราได้รับการออกแบบโดยเน้นการใช้งานมากกว่าประสิทธิภาพง่ายกว่าง่ายและปรับแต่งได้มากกว่า abstractions

- diffusers มีสามองค์ประกอบหลัก:

ท่อกระจายที่ล้ำสมัยที่สามารถเรียกใช้ในการอนุมานด้วยรหัสเพียงไม่กี่บรรทัด
ตัวกำหนดเวลาเสียงรบกวนที่ใช้แทนกันได้สำหรับความเร็วในการแพร่กระจายที่แตกต่างกันและคุณภาพเอาต์พุต
แบบจำลองที่ผ่านการฝึกอบรมซึ่งสามารถใช้เป็นหน่วยการสร้างและรวมกับตัวกำหนดตารางเวลาสำหรับการสร้างระบบการแพร่กระจายแบบ end-to-end ของคุณเอง

การติดตั้ง

เราขอแนะนำให้ติดตั้ง? diffusers ในสภาพแวดล้อมเสมือนจริงจาก PYPI หรือ conda สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการติดตั้ง Pytorch และ Flax โปรดดูเอกสารอย่างเป็นทางการของพวกเขา

pytorch

ด้วย pip (แพ็คเกจอย่างเป็นทางการ):

pip install --upgrade diffusers[torch]

กับ conda (ดูแลโดยชุมชน):

conda install -c conda-forge diffusers

แฟลกซ์

ด้วย pip (แพ็คเกจอย่างเป็นทางการ):

pip install --upgrade diffusers[flax]

การสนับสนุน Apple Silicon (M1/M2)

โปรดดูวิธีการใช้การแพร่กระจายที่มั่นคงในคู่มือ Apple Silicon

เร็ว

การสร้างเอาต์พุตเป็นเรื่องง่ายมาก? diffusers ในการสร้างภาพจากข้อความให้ใช้วิธี from_pretrained เพื่อโหลดรูปแบบการแพร่กระจายที่ผ่านมา (เรียกดูฮับสำหรับจุดตรวจ 30,000+ จุด):

 from diffusers import DiffusionPipeline
import torch

pipeline = DiffusionPipeline . from_pretrained ( "stable-diffusion-v1-5/stable-diffusion-v1-5" , torch_dtype = torch . float16 )
pipeline . to ( "cuda" )
pipeline ( "An image of a squirrel in Picasso style" ). images [ 0 ]

นอกจากนี้คุณยังสามารถขุดลงในกล่องเครื่องมือแบบจำลองและกำหนดตารางเวลาเพื่อสร้างระบบการแพร่กระจายของคุณเอง:

 from diffusers import DDPMScheduler , UNet2DModel
from PIL import Image
import torch

scheduler = DDPMScheduler . from_pretrained ( "google/ddpm-cat-256" )
model = UNet2DModel . from_pretrained ( "google/ddpm-cat-256" ). to ( "cuda" )
scheduler . set_timesteps ( 50 )

sample_size = model . config . sample_size
noise = torch . randn (( 1 , 3 , sample_size , sample_size ), device = "cuda" )
input = noise

for t in scheduler . timesteps :
    with torch . no_grad ():
        noisy_residual = model ( input , t ). sample
        prev_noisy_sample = scheduler . step ( noisy_residual , t , input ). prev_sample
        input = prev_noisy_sample

image = ( input / 2 + 0.5 ). clamp ( 0 , 1 )
image = image . cpu (). permute ( 0 , 2 , 3 , 1 ). numpy ()[ 0 ]
image = Image . fromarray (( image * 255 ). round (). astype ( "uint8" ))
image

ตรวจสอบ QuickStart เพื่อเปิดการเดินทางของคุณวันนี้!

วิธีนำทางเอกสาร

เอกสาร	ฉันเรียนรู้อะไรได้บ้าง?
การสอน	หลักสูตรความผิดพลาดขั้นพื้นฐานสำหรับการเรียนรู้วิธีการใช้คุณสมบัติที่สำคัญที่สุดของห้องสมุดเช่นการใช้โมเดลและตัวกำหนดเวลาเพื่อสร้างระบบการแพร่กระจายของคุณเองและฝึกอบรมรูปแบบการแพร่กระจายของคุณเอง
การโหลด	คู่มือสำหรับวิธีการโหลดและกำหนดค่าส่วนประกอบทั้งหมด (ท่อ, โมเดลและตารางเวลา) ของไลบรารีรวมถึงวิธีการใช้ตารางเวลาที่แตกต่างกัน
ท่อสำหรับการอนุมาน	คู่มือสำหรับวิธีการใช้ท่อสำหรับงานการอนุมานที่แตกต่างกันการสร้างแบบแบตช์การควบคุมเอาต์พุตที่สร้างขึ้นและการสุ่มและวิธีการมีส่วนร่วมไปป์ไลน์ไปยังห้องสมุด
การเพิ่มประสิทธิภาพ	คู่มือสำหรับวิธีการเพิ่มประสิทธิภาพของโมเดลการแพร่ของคุณให้ทำงานเร็วขึ้นและใช้หน่วยความจำน้อยลง
การฝึกอบรม	คู่มือสำหรับวิธีการฝึกอบรมแบบจำลองการแพร่กระจายสำหรับงานที่แตกต่างกันด้วยเทคนิคการฝึกอบรมที่แตกต่างกัน

ผลงาน

เรามีส่วนร่วมจากชุมชนโอเพ่นซอร์ส! หากคุณต้องการมีส่วนร่วมในห้องสมุดนี้โปรดตรวจสอบคู่มือการบริจาคของเรา คุณสามารถมองหาปัญหาที่คุณต้องการแก้ไขเพื่อมีส่วนร่วมในห้องสมุด

ดูปัญหาแรกที่ดีสำหรับโอกาสทั่วไปในการมีส่วนร่วม
ดูโมเดล / ไปป์ไลน์ใหม่เพื่อสนับสนุนรูปแบบการแพร่กระจายใหม่ที่น่าตื่นเต้น / ไปป์ไลน์การแพร่กระจาย
ดูกำหนดตารางเวลาใหม่

นอกจากนี้ในช่องทาง Discord สาธารณะของเรา เราหารือเกี่ยวกับแนวโน้มที่ร้อนแรงที่สุดเกี่ยวกับรูปแบบการแพร่กระจายช่วยเหลือซึ่งกันและกันด้วยการมีส่วนร่วมโครงการส่วนบุคคลหรือเพียงแค่ออกไปเที่ยว☕

งานและท่อยอดนิยม

งาน	ท่อส่ง	- ศูนย์กลาง
การสร้างภาพที่ไม่มีเงื่อนไข	DDPM	Google/DDPM-EMA-Church-256
ข้อความเป็นภาพ	ข้อความกระจายไปยังภาพที่เสถียร	เสถียร -Diffusion-V1-5/เสถียร -Diffusion-V1-5
ข้อความเป็นภาพ	ปลดปล่อย	Kakaobrain/Karlo-V1-Alpha
ข้อความเป็นภาพ	deepfloyd ถ้า	Deepfloyd/IF-I-XL-V1.0
ข้อความเป็นภาพ	Kandinsky	Kandinsky-Community/Kandinsky-2-2-2-Decoder
ภาพที่นำไปใช้กับภาพ	การควบคุม	lllyasviel/sd-controlnet-canny
ภาพที่นำไปใช้กับภาพ	cordspix2pix	Timbrooks/Instruct-Pix2pix
ภาพที่นำไปใช้กับภาพ	ภาพการแพร่กระจายไปยังภาพที่เสถียร	เสถียร -Diffusion-V1-5/เสถียร -Diffusion-V1-5
ภาพที่นำด้วยข้อความ	การแพร่กระจายที่เสถียรในการทาสี	RunwayML/Stable-Diffusion-Inpainting
รูปแบบของภาพ	รูปแบบการแพร่กระจายของภาพที่เสถียร	Lambdalabs/SD-Image-Variations-Diffusers
ความละเอียดสุดยอด	การแพร่กระจายที่เสถียร	เสถียรภาพ
ความละเอียดสุดยอด	การแพร่กระจายที่มีเสถียรภาพแฝง	ความเสถียร/SD-X2-latent-upscaler

ห้องสมุดยอดนิยมใช้? เครื่องกระจาย

https://github.com/microsoft/taskmatrix
https://github.com/invoke-ai/invokeai
https://github.com/instantid/instantid
https://github.com/apple/ml-stable-diffusion
https://github.com/sanster/lama-leaner
https://github.com/idea-research/grounded-segment-anythingthing
https://github.com/ashawkey/stable-dreamfusion
https://github.com/deep-floyd/if
https://github.com/bentoml/bentoml
https://github.com/bmaltais/kohya_ss
+14,000 ที่เก็บ GitHub ที่น่าทึ่งอื่น ๆ ?

ขอบคุณที่ใช้เรา❤

การให้เครดิต

ห้องสมุดนี้เป็นรูปธรรมก่อนหน้านี้โดยผู้เขียนหลายคนและจะเป็นไปไม่ได้หากไม่มีการวิจัยและการใช้งานที่ยอดเยี่ยม เราขอขอบคุณโดยเฉพาะอย่างยิ่งการใช้งานต่อไปนี้ซึ่งช่วยเราในการพัฒนาของเราและหากไม่มี API ที่ไม่สามารถขัดได้ในวันนี้:

@Compvis 'ห้องสมุดรูปแบบการแพร่กระจายแฝงอยู่ที่นี่
@hojonathanho การใช้งาน DDPM ดั้งเดิมมีให้ที่นี่รวมถึงการแปลที่มีประโยชน์อย่างมากเป็น pytorch โดย @pesser มีให้ที่นี่
การใช้งาน DDIM ของ @ermongroup มีให้ที่นี่
@Score-VE ของ @Yang-song และการใช้งาน Score-VP มีอยู่ที่นี่

นอกจากนี้เรายังต้องการขอบคุณ @heejkoo สำหรับภาพรวมที่เป็นประโยชน์ของเอกสารรหัสและทรัพยากรในรูปแบบการแพร่กระจายที่นี่รวมถึง @CrowsonKB และ @Rromb สำหรับการอภิปรายและข้อมูลเชิงลึกที่เป็นประโยชน์

การอ้างอิง

 @misc { von-platen-etal-2022-diffusers ,
  author = { Patrick von Platen and Suraj Patil and Anton Lozhkov and Pedro Cuenca and Nathan Lambert and Kashif Rasul and Mishig Davaadorj and Dhruv Nair and Sayak Paul and William Berman and Yiyi Xu and Steven Liu and Thomas Wolf } ,
  title = { Diffusers: State-of-the-art diffusion models } ,
  year = { 2022 } ,
  publisher = { GitHub } ,
  journal = { GitHub repository } ,
  howpublished = { url{https://github.com/huggingface/diffusers} }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.31.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-02
ขนาด 8.67MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด