SD3.5 和 SD3 的仅推理微型参考实现 - 使用 SD3.5/SD3 进行简单推理所需的一切,不包括权重文件。
包含文本编码器(OpenAI CLIP-L/14、OpenCLIP bigG、Google T5-XXL)(这些模型都是公开的)、VAE 解码器(类似于以前的 SD 模型,但 16 通道且没有 postquantconv 步骤)的代码,以及核心 MM-DiT(全新)。
注意:此存储库是一个参考库,旨在帮助合作伙伴组织实施 SD3.5/SD3。对于替代推理,请使用 Comfy。
从 HuggingFace 下载以下模型到models
目录中:
此代码也适用于 Stability AI SD3 Medium。
# Note: on windows use "python" not "python3"
python3 -s -m venv .sd3.5
source .sd3.5/bin/activate
# or on windows: venv/scripts/activate
python3 -s -m pip install -r requirements.txt
# Generate a cat using SD3.5 Large model (at models/sd3.5_large.safetensors) with its default settings
python3 sd3_infer.py --prompt " cute wallpaper art of a cat "
# Or use a text file with a list of prompts, using SD3.5 Large
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large.safetensors
# Generate from prompt file using SD3.5 Large Turbo with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large_turbo.safetensors
# Generate from prompt file using SD3.5 Medium with its default settings, at 2k resolution
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --width 1920 --height 1080
# Generate from prompt file using SD3 Medium with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3_medium.safetensors
默认情况下,图像将输出到outputs/
。要将后缀添加到输出目录,请添加--postfix
。例如,
python3 sd3_infer.py --prompt path/to/my_prompts.txt --postfix " steps100 " --steps 100
要更改生成图像的分辨率,请添加--width
。
(可选)使用“跳过层指导”,可以从 SD3.5-Medium 获得更好的结构和解剖一致性。
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --skip_layer_cfg True
sd3_infer.py
- 入口点,查看扩散模型的基本用法sd3_impls.py
- 包含 MMDiTX 和 VAE 的包装器other_impls.py
- 包含 CLIP 模型、T5 模型和一些实用程序mmditx.py
- 包含 MMDiT-X 本身的核心models
包含以下文件(单独下载):clip_l.safetensors
(OpenAI CLIP-L,与SDXL/SD3相同,可以获取公共副本)clip_g.safetensors
(openclip bigG,与SDXL/SD3相同,可以获取公共副本)t5xxl.safetensors
(google T5-v1.1-XXL,可以获取公共副本)sd3.5_large.safetensors
或sd3.5_large_turbo.safetensors
或sd3.5_medium.safetensors
(或sd3_medium.safetensors
)这里包含的代码源自:
检查许可证代码文件。
other_impls
中的一些代码源自 HuggingFace 并受 HuggingFace Transformers Apache2 许可证的约束