Очень простой веб-интерфейс для обучения FLUX LoRA с поддержкой LOW VRAM (12 ГБ/16 ГБ/20 ГБ).
FluxGym поддерживает 100% функций SD-скриптов Kohya через вкладку «Дополнительно», которая по умолчанию скрыта.
Модели автоматически загружаются, когда вы начинаете обучение с выбранной моделью.
Вы можете легко добавить больше к списку поддерживаемых моделей, отредактировав файл models.yaml. Если вы хотите поделиться интересными базовыми моделями, пришлите PR.
Вот люди, использующие Fluxgym для тренировок Лоры на месте и делящиеся своим опытом:
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Чтобы узнать больше, посетите эту ветку X: https://x.com/cocktailpeanut/status/1832084951115972653.
Вы можете автоматически установить и запустить все локально с помощью программы запуска Pinokio в один клик: https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Первый клон Fluxgym и kohya-ss/sd-скриптов:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Структура ваших папок будет выглядеть так:
/fluxgym
app.py
requirements.txt
/sd-scripts
Теперь активируйте venv из корневой папки fluxgym
:
Если вы используете Windows:
python -m venv env
envScriptsactivate
Если вы используете Linux:
python -m venv env
source env/bin/activate
Это создаст папку env
прямо под папкой fluxgym
:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
Теперь переходим в папку sd-scripts
и устанавливаем зависимости к активированной среде:
cd sd-scripts
pip install -r requirements.txt
Теперь вернитесь в корневую папку и установите зависимости приложения:
cd ..
pip install -r requirements.txt
Наконец, установите pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
Вернитесь в корневую папку fluxgym
, активировав venv, запустите:
python app.py
Перед запуском
python app.py
убедитесь, что venv активирован.Windows:
env/Scripts/activate
Linux:source env/bin/activate
Первый клон Fluxgym и kohya-ss/sd-скриптов:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Проверьте свой user id
и group id
и измените его, если он не 1000, с помощью environment variables
PUID
и PGID
. Вы можете узнать, что это такое в Linux, выполнив следующую команду: id
Теперь создайте образ и запустите его через docker-compose
:
docker compose up -d --build
Откройте веб-браузер и перейдите по IP-адресу компьютера/виртуальной машины: http://localhost:7860.
Использование довольно простое:
Вот и все!
По умолчанию Fluxgym не генерирует образцы изображений во время тренировки.
Однако вы можете настроить Fluxgym для автоматического создания образцов изображений для каждых N шагов. Вот как это выглядит:
Чтобы включить это, просто установите два поля:
Благодаря встроенному синтаксису kohya/sd-scripts вы можете точно контролировать, как генерируются образцы изображений на этапе обучения:
Допустим, триггерное слово — «человек». Обычно вы пробуете примеры подсказок, например:
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
Но для каждого запроса вы можете включить расширенные флаги , чтобы полностью контролировать процесс создания изображения. Например, флаг --d
позволяет указать SEED.
Указание начального значения означает, что каждый образец изображения будет использовать именно это начальное значение, а это означает, что вы буквально можете наблюдать за развитием LoRA. Вот пример использования:
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
Вот как это выглядит в пользовательском интерфейсе:
И вот результаты:
Помимо флага --d
, вы можете использовать и другие флаги:
--n
: Отрицательное приглашение к следующему варианту.--w
: определяет ширину создаваемого изображения.--h
: определяет высоту сгенерированного изображения.--d
: указывает начальное число сгенерированного изображения.--l
: определяет масштаб CFG сгенерированного изображения.--s
: указывает количество шагов в генерации. Также работают быстрые взвешивания, такие как ( )
и [ ]
. (Подробнее о внимании/акценте)
HF_TOKEN
(все локальные и частные).Вкладка «Дополнительно» создается автоматически путем анализа флагов запуска, доступных для последней версии sd-скриптов Kohya. Это означает, что Fluxgym — это полноценный пользовательский интерфейс для использования скрипта Kohya.
По умолчанию вкладка «Дополнительно» скрыта. Вы можете нажать «расширенный» аккордеон, чтобы развернуть его.
Вы также можете загрузить файлы подписей вместе с файлами изображений. Вам просто нужно следовать соглашению:
.txt
.img0.png
, соответствующий файл подписи должен быть img0.txt
.