UI da web extremamente simples para treinar FLUX LoRA com suporte para LOW VRAM (12GB/16GB/20GB).
FluxGym suporta 100% dos recursos de scripts SD do Kohya por meio de uma guia Avançado, que fica oculta por padrão.
Os modelos são baixados automaticamente quando você inicia o treinamento com o modelo selecionado.
Você pode adicionar facilmente mais modelos à lista de modelos suportados editando o arquivo models.yaml. Se você quiser compartilhar alguns modelos básicos interessantes, envie um PR.
Aqui estão pessoas que usam o Fluxgym para treinar Lora localmente, compartilhando sua experiência:
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Para saber mais, confira este tópico X: https://x.com/cocktailpeanut/status/1832084951115972653
Você pode instalar e iniciar tudo automaticamente localmente com o iniciador de 1 clique do Pinokio: https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Primeiro clone Fluxgym e kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Sua estrutura de pastas ficará assim:
/fluxgym
app.py
requirements.txt
/sd-scripts
Agora ative um venv na pasta raiz fluxgym
:
Se você estiver no Windows:
python -m venv env
envScriptsactivate
Se você estiver no Linux:
python -m venv env
source env/bin/activate
Isso criará uma pasta env
logo abaixo da pasta fluxgym
:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
Agora vá para a pasta sd-scripts
e instale as dependências no ambiente ativado:
cd sd-scripts
pip install -r requirements.txt
Agora volte para a pasta raiz e instale as dependências do aplicativo:
cd ..
pip install -r requirements.txt
Finalmente, instale o pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
Volte para a pasta raiz fluxgym
, com o venv ativado, execute:
python app.py
Certifique-se de ter o venv ativado antes de executar
python app.py
.Windows:
env/Scripts/activate
Linux:source env/bin/activate
Primeiro clone Fluxgym e kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Verifique seu user id
e group id
e altere-os se não for 1000 por meio de environment variables
PUID
e PGID
. Você pode descobrir o que são no Linux executando o seguinte comando: id
Agora construa a imagem e execute-a via docker-compose
:
docker compose up -d --build
Abra o navegador da web e vá para o endereço IP do computador/VM: http://localhost:7860
O uso é bastante simples:
Isso é tudo!
Por padrão, o fluxgym não gera nenhuma imagem de amostra durante o treinamento.
No entanto, você pode configurar o Fluxgym para gerar automaticamente imagens de amostra para cada N etapas. Aqui está o que parece:
Para ativar isso, basta definir os dois campos:
Graças à sintaxe integrada dos scripts kohya/sd, você pode controlar exatamente como as imagens de amostra são geradas durante a fase de treinamento:
Digamos que a palavra-chave seja pessoa hrld. Normalmente você tentaria exemplos de prompts como:
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
Mas para cada prompt você pode incluir sinalizadores avançados para controlar totalmente o processo de geração de imagens. Por exemplo, o sinalizador --d
permite especificar o SEED.
Especificar uma semente significa que cada imagem de amostra usará essa semente exata, o que significa que você pode literalmente ver o LoRA evoluir. Aqui está um exemplo de uso:
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
Esta é a aparência na IU:
E aqui estão os resultados:
Além do sinalizador --d
, aqui estão outros sinalizadores que você pode usar:
--n
: prompt negativo até a próxima opção.--w
: Especifica a largura da imagem gerada.--h
: Especifica a altura da imagem gerada.--d
: Especifica a semente da imagem gerada.--l
: Especifica a escala CFG da imagem gerada.--s
: especifica o número de etapas na geração. A ponderação imediata como ( )
e [ ]
também funciona. (Saiba mais sobre Atenção/Ênfase)
HF_TOKEN
(todos locais e privados).A guia avançada é construída automaticamente analisando os sinalizadores de inicialização disponíveis para a versão mais recente dos scripts kohya sd. Isso significa que Fluxgym é uma UI completa para usar o script Kohya.
Por padrão, a guia avançada está oculta. Você pode clicar no acordeão “avançado” para expandi-lo.
Você também pode fazer upload dos arquivos de legenda junto com os arquivos de imagem. Você só precisa seguir a convenção:
.txt
.img0.png
, o arquivo de legenda correspondente deverá ser img0.txt
.