Interface utilisateur Web très simple pour la formation de FLUX LoRA avec prise en charge de LOW VRAM (12 Go/16 Go/20 Go).
FluxGym prend en charge 100 % des fonctionnalités des scripts SD de Kohya via un onglet Avancé, masqué par défaut.
Les modèles sont automatiquement téléchargés lorsque vous démarrez l'entraînement avec le modèle sélectionné.
Vous pouvez facilement en ajouter d'autres à la liste des modèles pris en charge en modifiant le fichier models.yaml. Si vous souhaitez partager des modèles de base intéressants, veuillez envoyer un PR.
Voici des personnes qui utilisent Fluxgym pour entraîner Lora localement et qui partagent leur expérience :
https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Pour en savoir plus, consultez ce fil de discussion X : https://x.com/cocktailpeanut/status/1832084951115972653
Vous pouvez tout installer et lancer automatiquement localement avec le lanceur Pinokio en 1 clic : https://pinokio.computer/item?uri=https://github.com/cocktailpeanut/fluxgym
Premier clone de Fluxgym et kohya-ss/sd-scripts :
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
La structure de vos dossiers ressemblera à ceci :
/fluxgym
app.py
requirements.txt
/sd-scripts
Activez maintenant un venv depuis le dossier racine fluxgym
:
Si vous êtes sous Windows :
python -m venv env
envScriptsactivate
Si vous êtes sous Linux :
python -m venv env
source env/bin/activate
Cela créera un dossier env
juste en dessous du dossier fluxgym
:
/fluxgym
app.py
requirements.txt
/sd-scripts
/env
Allez maintenant dans le dossier sd-scripts
et installez les dépendances dans l'environnement activé :
cd sd-scripts
pip install -r requirements.txt
Revenez maintenant au dossier racine et installez les dépendances de l'application :
cd ..
pip install -r requirements.txt
Enfin, installez pytorch Nightly :
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
Revenez au dossier racine fluxgym
, avec le venv activé, exécutez :
python app.py
Assurez-vous d'avoir activé venv avant d'exécuter
python app.py
.Windows :
env/Scripts/activate
Linux :source env/bin/activate
Premier clone de Fluxgym et kohya-ss/sd-scripts :
git clone https://github.com/cocktailpeanut/fluxgym
cd fluxgym
git clone -b sd3 https://github.com/kohya-ss/sd-scripts
Vérifiez votre user id
et group id
et modifiez-les s'il ne s'agit pas de 1000 via environment variables
PUID
et PGID
. Vous pouvez découvrir de quoi il s'agit sous Linux en exécutant la commande suivante : id
Maintenant, construisez l'image et exécutez-la via docker-compose
:
docker compose up -d --build
Ouvrez le navigateur Web et accédez à l'adresse IP de l'ordinateur/de la VM : http://localhost:7860
L'utilisation est assez simple :
C'est tout !
Par défaut, fluxgym ne génère aucun échantillon d'images pendant l'entraînement.
Vous pouvez cependant configurer Fluxgym pour générer automatiquement des exemples d'images toutes les N étapes. Voici à quoi cela ressemble :
Pour l'activer, définissez simplement les deux champs :
Grâce à la syntaxe intégrée de kohya/sd-scripts, vous pouvez contrôler exactement comment les exemples d'images sont générés pendant la phase de formation :
Disons que le mot déclencheur est « personne humaine ». Normalement, vous essaieriez des exemples d'invites telles que :
hrld person is riding a bike
hrld person is a body builder
hrld person is a rock star
Mais pour chaque invite, vous pouvez inclure des indicateurs avancés pour contrôler entièrement le processus de génération d'image. Par exemple, l'indicateur --d
vous permet de spécifier le SEED.
Spécifier une graine signifie que chaque exemple d’image utilisera exactement cette graine, ce qui signifie que vous pouvez littéralement voir la LoRA évoluer. Voici un exemple d'utilisation :
hrld person is riding a bike --d 42
hrld person is a body builder --d 42
hrld person is a rock star --d 42
Voici à quoi cela ressemble dans l'interface utilisateur :
Et voici les résultats :
En plus de l'option --d
, voici d'autres options que vous pouvez utiliser :
--n
: Invite négative jusqu'à l'option suivante.--w
: Spécifie la largeur de l'image générée.--h
: Spécifie la hauteur de l'image générée.--d
: Spécifie la graine de l'image générée.--l
: Spécifie l'échelle CFG de l'image générée.--s
: Spécifie le nombre d'étapes dans la génération. Les pondérations d'invite telles que ( )
et [ ]
fonctionnent également. (En savoir plus sur l'attention/l'accentuation)
HF_TOKEN
(Tous local et privé).L'onglet avancé est automatiquement construit en analysant les indicateurs de lancement disponibles pour la dernière version des scripts Kohya SD. Cela signifie que Fluxgym est une interface utilisateur à part entière pour utiliser le script Kohya.
Par défaut, l'onglet avancé est masqué. Vous pouvez cliquer sur l'accordéon "avancé" pour le développer.
Vous pouvez également télécharger les fichiers de légendes avec les fichiers image. Il vous suffit de suivre la convention :
.txt
.img0.png
, le fichier de légende correspondant doit être img0.txt
.