低 VRAM (12GB/16GB/20GB) をサポートする FLUX LoRA トレーニング用の非常にシンプルな Web UI。
FluxGym は、デフォルトでは非表示になっている [詳細設定] タブを通じて、Kohya sd-scripts 機能を 100% サポートします。
モデルを選択してトレーニングを開始すると、モデルが自動的にダウンロードされます。
models.yaml ファイルを編集することで、サポートされているモデルのリストに簡単に追加できます。興味深いベースモデルを共有したい場合は、PR を送信してください。
以下は、Fluxgym を使用して Lora をローカルでトレーニングしている人々で、その経験を共有しています。
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
詳細については、この X スレッドをチェックしてください: https://x.com/cocktailpeanut/status/1832084951115972653
Pinokio 1-click ランチャーを使用すると、すべてを自動的にローカルにインストールして起動できます: https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
最初に Fluxgym と kohya-ss/sd-scripts をクローンします。
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
フォルダー構造は次のようになります。
/fluxgym
app.py
requirements.txt
/sd-scripts
ここで、ルートのfluxgym
フォルダーから venv をアクティブ化します。
Windows を使用している場合:
python -m venv env
envScriptsactivate
Linux を使用している場合:
python -m venv env
source env/bin/activate
これにより、 fluxgym
フォルダーの直下にenv
フォルダーが作成されます。
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
次に、 sd-scripts
フォルダーに移動し、アクティブ化された環境に依存関係をインストールします。
cd sd-scripts
pip install -r requirements.txt
次に、ルート フォルダーに戻り、アプリの依存関係をインストールします。
cd ..
pip install -r requirements.txt
最後に、pytorch Nightly をインストールします。
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
ルートのfluxgym
フォルダーに戻り、venv をアクティブにして、次を実行します。
python app.py
python app.py
実行する前に、必ず venv をアクティブ化してください。Windows:
env/Scripts/activate
Linux:source env/bin/activate
最初に Fluxgym と kohya-ss/sd-scripts をクローンします。
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
user id
とgroup id
を確認し、 PUID
とPGID
のenvironment variables
を使用して 1000 でない場合は変更します。次のコマンドを実行すると、Linux でこれらが何であるかを確認できます: id
次に、イメージをビルドし、 docker-compose
経由で実行します。
docker compose up -d --build
Web ブラウザを開いて、コンピュータ/VM の IP アドレスに移動します: http://localhost:7860
使用方法は非常に簡単です。
それだけです!
デフォルトでは、fluxgym はトレーニング中にサンプル画像を生成しません。
ただし、N ステップごとにサンプル イメージを自動的に生成するように Fluxgym を構成することもできます。以下にその様子を示します。
これをオンにするには、次の 2 つのフィールドを設定するだけです。
kohya/sd-scripts の組み込み構文のおかげで、トレーニング段階でサンプル イメージがどのように生成されるかを正確に制御できます。
トリガーワードがhrld person であるとします。通常は、次のようなサンプル プロンプトを試します。
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
ただし、すべてのプロンプトに高度なフラグを含めて、イメージ生成プロセスを完全に制御できます。たとえば、 --d
フラグを使用すると、SEED を指定できます。
シードを指定すると、すべてのサンプル画像がその正確なシードを使用することになり、文字通り LoRA の進化を確認できることになります。使用例を次に示します。
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
UI では次のようになります。
そして結果は次のとおりです。
--d
フラグに加えて、次のような他のフラグを使用できます。
--n
: 次のオプションまでの否定プロンプト。--w
: 生成される画像の幅を指定します。--h
: 生成される画像の高さを指定します。--d
: 生成されるイメージのシードを指定します。--l
: 生成されるイメージの CFG スケールを指定します。--s
: 生成のステップ数を指定します。 ( )
や[ ]
などのプロンプトの重み付けも機能します。 (注意/強調について詳しくはこちらをご覧ください)
HF_TOKEN
という名前のローカル ファイルに保存されます (すべてローカルおよびプライベート)。詳細タブは、kohya sd-scripts の最新バージョンで利用可能な起動フラグを解析することによって自動的に構築されます。これは、Fluxgym が Kohya スクリプトを使用するための本格的な UI であることを意味します。
デフォルトでは、詳細タブは非表示になっています。 「詳細」アコーディオンをクリックして展開できます。
画像ファイルと一緒にキャプション ファイルをアップロードすることもできます。次の規則に従うだけで済みます。
.txt
ファイルである必要があります。img0.png
という名前の画像ファイルがある場合、対応するキャプション ファイルはimg0.txt
である必要があります。