用于训练 FLUX LoRA 的极其简单的 Web UI ,支持低 VRAM (12GB/16GB/20GB)。
FluxGym 通过“高级”选项卡支持 100% Kohya sd-scripts 功能,默认情况下该选项卡是隐藏的。
当您使用所选模型开始训练时,会自动下载模型。
您可以通过编辑 models.yaml 文件轻松地将更多内容添加到支持的模型列表中。如果您想分享一些有趣的基础模型,请发送 PR。
以下是使用 Fluxgym 本地训练 Lora 的人分享他们的经验:
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
要了解更多信息,请查看此 X 线程:https://x.com/cocktailpeanut/status/1832084951115972653
您可以使用 Pinokio 一键启动器在本地自动安装和启动所有内容:https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
首先克隆 Fluxgym 和 kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
您的文件夹结构将如下所示:
/fluxgym
app.py
requirements.txt
/sd-scripts
现在从fluxgym
根文件夹激活 venv:
如果您使用的是 Windows:
python -m venv env
envScriptsactivate
如果您使用的是 Linux:
python -m venv env
source env/bin/activate
这将在fluxgym
文件夹正下方创建一个env
文件夹:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
现在转到sd-scripts
文件夹并将依赖项安装到激活的环境中:
cd sd-scripts
pip install -r requirements.txt
现在返回根文件夹并安装应用程序依赖项:
cd ..
pip install -r requirements.txt
最后,安装 pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
返回到fluxgym
根文件夹,激活 venv,运行:
python app.py
确保在运行
python app.py
之前激活 venv。Windows:
env/Scripts/activate
Linux:source env/bin/activate
首先克隆 Fluxgym 和 kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
检查您的user id
和group id
,如果不是 1000,请通过PUID
和PGID
environment variables
进行更改。你可以通过运行以下命令来了解这些在 Linux 中的含义: id
现在构建镜像并通过docker-compose
运行它:
docker compose up -d --build
打开 Web 浏览器并转到计算机/VM 的 IP 地址:http://localhost:7860
用法非常简单:
就这样!
默认情况下,fluxgym 在训练期间不会生成任何样本图像。
不过,您可以将 Fluxgym 配置为每 N 个步骤自动生成示例图像。它看起来是这样的:
要打开此功能,只需设置两个字段:
得益于 kohya/sd-scripts 的内置语法,您可以准确控制在训练阶段如何生成示例图像:
假设触发词是hrld person。通常您会尝试以下示例提示:
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
但对于每个提示,您都可以包含高级标志来完全控制图像生成过程。例如, --d
标志允许您指定 SEED。
指定种子意味着每个样本图像都将使用该种子,这意味着您可以从字面上看到 LoRA 的演变。这是一个用法示例:
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
用户界面如下所示:
结果如下:
除了--d
标志之外,您还可以使用以下其他标志:
--n
:否定提示直到下一个选项。--w
:指定生成图像的宽度。--h
:指定生成图像的高度。--d
:指定生成图像的种子。--l
:指定生成图像的CFG比例。--s
:指定生成的步骤数。 ( )
和[ ]
等提示权重也有效。 (了解更多关于注意力/强调的信息)
HF_TOKEN
的本地文件中(所有本地文件和私有文件)。高级选项卡是通过解析最新版本的 kohya sd-scripts 可用的启动标志自动构建的。这意味着 Fluxgym 是一个使用 Kohya 脚本的成熟 UI。
默认情况下,高级选项卡是隐藏的。您可以单击“高级”手风琴将其展开。
您还可以将标题文件与图像文件一起上传。您只需要遵循约定:
.txt
文件。img0.png
的图像文件,则相应的标题文件必须是img0.txt
。