sd3.5ダウンロード - sd3.5ソースコードのダウンロード

sd3.5

その他のソースコード

ダウンロード

安定拡散 3.5

SD3.5 および SD3 の推論専用の小さなリファレンス実装 - 重みファイルを除く、SD3.5/SD3 を使用した単純な推論に必要なものすべて。

テキストエンコーダー (OpenAI CLIP-L/14、OpenCLIP bigG、Google T5-XXL) (これらのモデルはすべて公開されています)、VAE デコーダー (以前の SD モデルに似ていますが、16 チャネルで postquantconv ステップがありません) のコードが含まれています。そしてコアの MM-DiT (まったく新しい)。

注: このリポジトリは、パートナー組織による SD3.5/SD3 の実装を支援することを目的としたリファレンスライブラリです。代替推論には Comfy を使用します。

アップデート

2024 年 10 月 29 日 : SD3.5-Medium の推論コードをリリースしました。
2024 年 10 月 24 日 : コードライセンスを MIT ライセンスに更新しました。
2024 年 10 月 22 日 : SD3.5-Large、Large-Turbo の推論コードを公開しました。 SD3-Mediumでも動作します。

ダウンロード

次のモデルを HuggingFace からmodelsディレクトリにダウンロードします。

安定性 AI SD3.5 大または安定性 AI SD3.5 大型ターボまたは安定性 AI SD3.5 中
OpenAI CLIP-L
OpenCLIP bigG
Google T5-XXL

このコードは Stability AI SD3 Medium でも機能します。

インストール

 # Note: on windows use "python" not "python3"
python3 -s -m venv .sd3.5
source .sd3.5/bin/activate
# or on windows: venv/scripts/activate
python3 -s -m pip install -r requirements.txt

走る

 # Generate a cat using SD3.5 Large model (at models/sd3.5_large.safetensors) with its default settings
python3 sd3_infer.py --prompt " cute wallpaper art of a cat "
# Or use a text file with a list of prompts, using SD3.5 Large
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large.safetensors
# Generate from prompt file using SD3.5 Large Turbo with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large_turbo.safetensors
# Generate from prompt file using SD3.5 Medium with its default settings, at 2k resolution
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --width 1920 --height 1080
# Generate from prompt file using SD3 Medium with its default settings
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3_medium.safetensors

画像はデフォルトで、 outputs/<MODEL>/<PROMPT>_<DATETIME>_<POSTFIX>に出力されます。出力ディレクトリに接尾辞を追加するには、 --postfix <my_postfix>を追加します。例えば、

python3 sd3_infer.py --prompt path/to/my_prompts.txt --postfix " steps100 " --steps 100

生成された画像の解像度を変更するには、 --width <WIDTH> --height <HEIGHT>を追加します。

オプションで、SD3.5-Medium の構造と解剖学的構造の一貫性が向上する可能性があるため、スキップレイヤガイダンスを使用します。

python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_medium.safetensors --skip_layer_cfg True

ファイルガイド

sd3_infer.py - エントリポイント。拡散モデルの基本的な使用法についてはこれを確認してください。
sd3_impls.py - MMDiTX と VAE のラッパーが含まれています
other_impls.py - CLIP モデル、T5 モデル、およびいくつかのユーティリティが含まれています
mmditx.py - MMDiT-X 自体のコアが含まれています
次のファイルを含むフォルダーmodels (別途ダウンロード):
- clip_l.safetensors (OpenAI CLIP-L、SDXL/SD3 と同じ、パブリックコピーを取得できます)
- clip_g.safetensors (openclip bigG、SDXL/SD3 と同じ、パブリックコピーを取得できます)
- t5xxl.safetensors (Google T5-v1.1-XXL、公開コピーを取得できます)
- sd3.5_large.safetensorsまたはsd3.5_large_turbo.safetensorsまたはsd3.5_medium.safetensors (またはsd3_medium.safetensors )