Interfaz de usuario web muy sencilla para entrenar FLUX LoRA con soporte de VRAM BAJA (12 GB/16 GB/20 GB).
FluxGym admite el 100% de las funciones de Kohya sd-scripts a través de una pestaña Avanzado, que está oculta de forma predeterminada.
Los modelos se descargan automáticamente cuando comienzas a entrenar con el modelo seleccionado.
Puede agregar fácilmente más a la lista de modelos compatibles editando el archivo models.yaml. Si desea compartir algunos modelos base interesantes, envíe un PR.
Aquí hay personas que usan Fluxgym para entrenar localmente a Lora y comparten su experiencia:
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Para obtener más información, consulte este hilo X: https://x.com/cocktailpeanut/status/1832084951115972653
Puede instalar e iniciar todo automáticamente de forma local con el iniciador de 1 clic de Pinokio: https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Primer clon de Fluxgym y kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Su estructura de carpetas se verá así:
/fluxgym
app.py
requirements.txt
/sd-scripts
Ahora active un venv desde la carpeta raíz fluxgym
:
Si estás en Windows:
python -m venv env
envScriptsactivate
Si estás en Linux:
python -m venv env
source env/bin/activate
Esto creará una carpeta env
justo debajo de la carpeta fluxgym
:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
Ahora vaya a la carpeta sd-scripts
e instale las dependencias en el entorno activado:
cd sd-scripts
pip install -r requirements.txt
Ahora regrese a la carpeta raíz e instale las dependencias de la aplicación:
cd ..
pip install -r requirements.txt
Finalmente, instale pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
Regrese a la carpeta raíz fluxgym
, con el venv activado, ejecute:
python app.py
Asegúrese de tener el venv activado antes de ejecutar
python app.py
Windows:
env/Scripts/activate
Linux:source env/bin/activate
Primer clon de Fluxgym y kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Verifique su user id
y group id
y cámbielos si no es 1000 mediante environment variables
de PUID
y PGID
. Puede averiguar cuáles son en Linux ejecutando el siguiente comando: id
Ahora construye la imagen y ejecútala mediante docker-compose
:
docker compose up -d --build
Abra el navegador web y vaya a la dirección IP de la computadora/VM: http://localhost:7860
El uso es bastante sencillo:
¡Eso es todo!
Por defecto, fluxgym no genera ninguna imagen de muestra durante el entrenamiento.
Sin embargo, puedes configurar Fluxgym para que genere automáticamente imágenes de muestra por cada N pasos. Así es como se ve:
Para activar esto, simplemente configure los dos campos:
Gracias a la sintaxis incorporada de kohya/sd-scripts, puedes controlar exactamente cómo se generan las imágenes de muestra durante la fase de entrenamiento:
Digamos que la palabra desencadenante es tercera persona. Normalmente probaría mensajes de muestra como:
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
Pero para cada mensaje, puede incluir indicadores avanzados para controlar completamente el proceso de generación de imágenes. Por ejemplo, el indicador --d
le permite especificar la SEMILLA.
Especificar una semilla significa que cada imagen de muestra usará esa semilla exacta, lo que significa que literalmente puedes ver cómo evoluciona LoRA. A continuación se muestra un ejemplo de uso:
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
Así es como se ve en la interfaz de usuario:
Y aquí están los resultados:
Además de la opción --d
, aquí hay otras opciones que puedes usar:
--n
: mensaje negativo hasta la siguiente opción.--w
: Especifica el ancho de la imagen generada.--h
: Especifica la altura de la imagen generada.--d
: Especifica la semilla de la imagen generada.--l
: Especifica la escala CFG de la imagen generada.--s
: Especifica el número de pasos en la generación. La ponderación rápida como ( )
y [ ]
también funciona. (Obtenga más información sobre Atención/Énfasis)
HF_TOKEN
(Todo local y privado).La pestaña avanzada se construye automáticamente analizando los indicadores de inicio disponibles para la última versión de kohya sd-scripts. Esto significa que Fluxgym es una interfaz de usuario completa para usar el script Kohya.
Por defecto, la pestaña avanzada está oculta. Puede hacer clic en el acordeón "avanzado" para expandirlo.
También puede cargar los archivos de títulos junto con los archivos de imagen. Sólo necesitas seguir la convención:
.txt
.img0.png
, el archivo de título correspondiente debe ser img0.txt
.