用於訓練 FLUX LoRA 的極其簡單的 Web UI ,支援低 VRAM (12GB/16GB/20GB)。
FluxGym 透過「進階」標籤支援 100% Kohya sd-scripts 功能,預設情況下該分頁是隱藏的。
當您使用所選模型開始訓練時,會自動下載模型。
您可以透過編輯 models.yaml 檔案輕鬆地將更多內容新增至支援的模型清單。如果您想分享一些有趣的基礎模型,請發送 PR。
以下是使用 Fluxgym 本地訓練 Lora 的人分享他們的經驗:
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
要了解更多信息,請查看此 X 線程:https://x.com/cocktailpeanut/status/1832084951115972653
您可以使用 Pinokio 一鍵啟動器在本地自動安裝和啟動所有內容:https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
首先克隆 Fluxgym 和 kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
您的資料夾結構將如下所示:
/fluxgym
app.py
requirements.txt
/sd-scripts
現在從fluxgym
根資料夾啟動 venv:
如果您使用的是 Windows:
python -m venv env
envScriptsactivate
如果您使用的是 Linux:
python -m venv env
source env/bin/activate
這將在fluxgym
資料夾正下方建立一個env
資料夾:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
現在轉到sd-scripts
資料夾並將依賴項安裝到已啟動的環境中:
cd sd-scripts
pip install -r requirements.txt
現在返回根資料夾並安裝應用程式依賴項:
cd ..
pip install -r requirements.txt
最後,安裝 pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
返回fluxgym
根資料夾,啟動 venv,運行:
python app.py
確保在運行
python app.py
之前啟動 venv。Windows:
env/Scripts/activate
Linux:source env/bin/activate
首先克隆 Fluxgym 和 kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
檢查您的user id
和group id
,如果不是 1000,請透過PUID
和PGID
environment variables
進行變更。你可以透過執行以下命令來了解這些在 Linux 中的意義: id
現在建置映像並透過docker-compose
運行它:
docker compose up -d --build
開啟 Web 瀏覽器並前往電腦/VM 的 IP 位址:http://localhost:7860
用法非常簡單:
就這樣!
預設情況下,fluxgym 在訓練期間不會產生任何樣本影像。
不過,您可以將 Fluxgym 配置為每 N 個步驟自動產生範例影像。它看起來是這樣的:
要開啟此功能,只需設定兩個欄位:
由於 kohya/sd-scripts 的內建語法,您可以準確控制在訓練階段如何產生範例影像:
假設觸發詞是hrld person。通常您會嘗試以下範例提示:
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
但對於每個提示,您都可以包含高級標誌來完全控制影像生成過程。例如, --d
標誌允許您指定 SEED。
指定種子意味著每個樣本圖像都將使用該種子,這意味著您可以從字面上看到 LoRA 的演變。這是一個用法範例:
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
使用者介面如下所示:
結果如下:
除了--d
標誌之外,您還可以使用以下其他標誌:
--n
:否定提示直到下一個選項。--w
:指定生成影像的寬度。--h
:指定生成影像的高度。--d
:指定產生影像的種子。--l
:指定產生影像的CFG比例。--s
:指定產生的步驟數。 ( )
和[ ]
等提示權重也有效。 (了解更多關於注意力/強調的資訊)
HF_TOKEN
的本機檔案中(所有本機檔案和私人檔案)。高級選項卡是透過解析最新版本的 kohya sd-scripts 可用的啟動標誌自動建構的。這意味著 Fluxgym 是一個使用 Kohya 腳本的成熟 UI。
預設情況下,高級選項卡是隱藏的。您可以單擊“高級”手風琴將其展開。
您也可以將標題檔案與圖像檔案一起上傳。您只需要遵循約定:
.txt
檔。img0.png
的圖像文件,則相應的標題文件必須是img0.txt
。