SD3.5 和 SD3 的僅推理微型參考實作 - 使用 SD3.5/SD3 進行簡單推理所需的一切,不包括權重檔案。
包含文字編碼器(OpenAI CLIP-L/14、OpenCLIP bigG、Google T5-XXL)(這些模型都是公開的)、VAE 解碼器(類似於先前的SD 模型,但16 通道且沒有postquantconv 步驟)的程式碼,以及核心 MM-DiT(全新)。
注意:此儲存庫是一個參考庫,旨在幫助合作夥伴組織實施 SD3.5/SD3。對於替代推理,請使用 Comfy。
從 HuggingFace 下載以下型號到models
目錄:
此代碼也適用於 Stability AI SD3 Medium。
# Note: on windows use "python" not "python3"
python3 -s -m venv .sd3.5
source .sd3.5/bin/activate
# or on windows: venv/scripts/activate
python3 -s -m pip install -r requirements.txt
# Generate a cat using SD3.5 Large model (at models/sd3.5_large.safetensors) with its default settings
python3 sd3_infer.py --prompt " cute wallpaper art of a cat "
# Or use a text file with a list of prompts, using SD3.5 Large
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large.safetensors
# Generate from prompt file using SD3.5 Large Turbo with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large_turbo.safetensors
# Generate from prompt file using SD3.5 Medium with its default settings, at 2k resolution
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --width 1920 --height 1080
# Generate from prompt file using SD3 Medium with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3_medium.safetensors
預設情況下,影像將輸出到outputs/
。若要將後綴加入輸出目錄,請新增--postfix
。例如,
python3 sd3_infer.py --prompt path/to/my_prompts.txt --postfix " steps100 " --steps 100
若要變更生成影像的分辨率,請新增--width
。
(可選)使用“跳過層指導”,可以從 SD3.5-Medium 獲得更好的結構和解剖一致性。
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --skip_layer_cfg True
sd3_infer.py
- 入口點,查看擴散模型的基本用法sd3_impls.py
- 包含 MMDiTX 和 VAE 的包裝器other_impls.py
- 包含 CLIP 模型、T5 模型和一些實用程序mmditx.py
- 包含 MMDiT-X 本身的核心models
包含以下檔案(單獨下載):clip_l.safetensors
(OpenAI CLIP-L,與SDXL/SD3相同,可取得公開副本)clip_g.safetensors
(openclip bigG,與SDXL/SD3相同,可以取得公共副本)t5xxl.safetensors
(google T5-v1.1-XXL,可取得公開副本)sd3.5_large.safetensors
或sd3.5_large_turbo.safetensors
或sd3.5_medium.safetensors
(或sd3_medium.safetensors
)這裡包含的程式碼源自:
檢查許可證代碼檔案。
other_impls
中的一些程式碼源自 HuggingFace 並受 HuggingFace Transformers Apache2 授權的約束