Скачать sd scripts - sd scripts скачать исходный код

sd scripts

Другой исходный код

Version 0.8.7

Скачать

Этот репозиторий содержит сценарии обучения, генерации и утилиты для Stable Diffusion.

История изменений перемещена в конец страницы. 更新履歴はページ末尾に移しました。

日本語版READMEはこちら

Версия для разработки находится в ветке dev . Пожалуйста, проверьте ветку разработки на наличие последних изменений.

Поддержка FLUX.1 и SD3/SD3.5 осуществляется в ветке sd3 . Если вы хотите их обучить, используйте ветку sd3.

Для более простого использования (графический интерфейс пользователя, сценарии PowerShell и т. д.) посетите репозиторий, поддерживаемый bmaltais. Спасибо @bmaltais!

Этот репозиторий содержит скрипты для:

Обучение DreamBooth, включая U-Net и Text Encoder
Точная настройка (встроенное обучение), включая U-Net и Text Encoder
Обучение ЛоРА
Обучение текстовой инверсии
Генерация изображений
Преобразование модели (поддерживает версии 1.x и 2.x, Stable Diffision ckpt/safetensors и диффузоры)

О требованиях.txt

Файл не содержит требований для PyTorch. Поскольку версия PyTorch зависит от среды, она не включена в файл. Пожалуйста, сначала установите PyTorch в соответствии с средой. См. инструкции по установке ниже.

Скрипты протестированы с помощью Pytorch 2.1.2. 2.0.1 и 1.12.1 не проверялись, но должны работать.

Ссылки на документацию по использованию

Большая часть документов написана на японском языке.

Английский перевод от darkstorm2150 находится здесь. Спасибо darkstorm2150!

Руководство по обучению – общее: подготовка данных, опции и т. д.
- Китайская версия
Обучение SDXL (английская версия)
Конфигурация набора данных
- Английская версия
Учебное пособие DreamBooth
Пошаговое руководство по тонкой настройке:
Обучение ЛоРА
Тренировочная текстовая инверсия
Генерация изображений
note.com Преобразование модели

Требуемые зависимости Windows

Python 3.10.6 и Git:

Python 3.10.6: https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe
git: https://git-scm.com/download/win

Предоставьте неограниченный доступ сценариям к PowerShell, чтобы venv мог работать:

Откройте окно PowerShell администратора.
Введите Set-ExecutionPolicy Unrestricted и ответьте A.
Закрыть окно администратора PowerShell

Установка Windows

Откройте обычный терминал Powershell и введите в него следующее:

git clone https: // github.com / kohya - ss / sd - scripts.git
cd sd - scripts

python - m venv venv
.venvScriptsactivate

pip install torch == 2.1 . 2 torchvision == 0.16 . 2 -- index - url https: // download.pytorch.org / whl / cu118
pip install -- upgrade - r requirements.txt
pip install xformers == 0.0 . 23. post1 -- index - url https: // download.pytorch.org / whl / cu118

accelerate config

Если python -m venv показывает только python , измените python на py .

Примечание. Теперь в файл require.txt включены bitsandbytes==0.43.0 , prodigyopt==1.0 и lion-pytorch==0.0.6 . Если вы хотите использовать другую версию, установите ее вручную.

Эта установка предназначена для CUDA 11.8. Если вы используете другую версию CUDA, установите соответствующую версию PyTorch и xformers. Например, если вы используете CUDA 12, установите pip install torch==2.1.2 torchvision==0.16.2 --index-url https://download.pytorch.org/whl/cu121 и pip install xformers==0.0.23.post1 --index-url https://download.pytorch.org/whl/cu121 .

Ответы для ускорения конфига:

- This machine
- No distributed training
- NO
- NO
- NO
- all
- fp16

Если вы хотите использовать bf16, ответьте bf16 на последний вопрос.

Примечание. Некоторые пользовательские отчеты ValueError: fp16 mixed precision requires a GPU . В этом случае ответьте 0 на 6-й вопрос: What GPU(s) (by id) should be used for training on this machine as a comma-separated list? [all]:

(Будет использоваться один графический процессор с идентификатором 0 )

Обновление

Когда выйдет новая версия, вы можете обновить свой репозиторий с помощью следующей команды:

cd sd - scripts
git pull
.venvScriptsactivate
pip install -- use-pep517 -- upgrade - r requirements.txt

После успешного выполнения команд вы будете готовы к использованию новой версии.

Обновить PyTorch

Если вы хотите обновить PyTorch, вы можете обновить его с помощью команды pip install в разделе «Установка Windows». xformers также необходимо обновить при обновлении PyTorch.

Кредиты

Реализация LoRA основана на репозитории cloneofsimo. Спасибо за отличную работу!

Расширение LoRA для Conv2d 3x3 было первоначально выпущено cloneofsimo, а его эффективность была продемонстрирована на LoCon компанией KohakuBlueleaf. Огромное спасибо, KohakuBlueleaf!

Лицензия

Большинство скриптов лицензируется под ASL 2.0 (включая коды от Diffusers, cloneofsimo's и LoCon), однако части проекта доступны по отдельным условиям лицензии:

Эффективное использование памяти. Pytorch: Массачусетский технологический институт.

биты и байты: Массачусетский технологический институт

BLIP: пункт BSD-3

История изменений

27 октября 2024 г. / 27.10.2024:

svd_merge_lora.py Использование VRAM было уменьшено. Однако использование основной памяти увеличится (достаточно 32 ГБ).
Это будет включено в следующий выпуск.
svd_merge_lora.pyのVRAM 用量を削減しました。ただし、メインメモリの使用量は増加します（32 ГБあれば十分です）。
これは次回リリースに含まれます。

26 октября 2024 г. / 26 октября 2024 г.:

Исправлена ошибка в svd_merge_lora.py , sdxl_merge_lora.py и resize_lora.py , из-за которой хэш-значение метаданных LoRA вычислялось неправильно, если save_precision отличалась от precision использованной при расчете. Подробности см. в выпуске № 1722. Спасибо ДжуджоХотару за поднятый вопрос.
Он будет включен в следующий выпуск.
svd_merge_lora.py 、 sdxl_merge_lora.py 、 resize_lora.pyで、保存時の精度が計算時の精度と異なる場合、L oRAメタデータのハッシュ値が正しく計算されない不具合を修正しました。詳細はвыпуск № 1722 をご覧ください。問題提起していただいた ДжуджоХотару 氏に感謝します。
以上は次回リリースに含まれます。

13 сентября 2024 г. / 13 сентября 2024 г.:

sdxl_merge_lora.py теперь поддерживает OFT. Спасибо Мару-ми за PR №1580.
svd_merge_lora.py теперь поддерживает LBW. Спасибо terracottahaniwa. Подробности см. в PR № 1575.
sdxl_merge_lora.py также поддерживает LBW.
Подробную информацию о LBW см. в разделе «Вес блока LoRA» от hako-mikan.
Они будут включены в следующий выпуск.
sdxl_merge_lora.pyが OFT をサポートされました。PR #1580 Мару-ми 氏に感謝します。
svd_merge_lora.pyで LBW がサポートされました。PR #1575 terracottahaniwa 氏に感謝します。
sdxl_merge_lora.pyでも LBW がサポートされました。
LBW の詳細は hako-mikan 氏の LoRA Block Weight をご覧ください。
以上は次回リリースに含まれます。

23 июня 2024 г. / 23 июня 2024 г.:

Исправлены неработающие cache_latents.py и cache_text_encoder_outputs.py . (Будет включено в следующий выпуск.)
cache_latents.pyおよびcache_text_encoder_outputs.pyが動作しなくなっていたのを修正しました。(次回リリースに含まれます。)

7 апреля 2024 г. / 07.04.2024: v0.8.7

Значение по умолчанию huber_schedule в Scheduled Huber Loss изменено с exponential на snr , что, как ожидается, даст лучшие результаты.
Запланированные потери Хубера のhuber_scheduleのデフォルト値をexponentialから、より良い結果が期待できるsnrに変更しました。

7 апреля 2024 г. / 07.04.2024: v0.8.6

Основные моменты

Зависимые библиотеки обновляются. См. раздел Обновление и обновление библиотек.
- В частности, недавно был добавлен imagesize , поэтому, если вы не можете обновить библиотеки немедленно, установите его с помощью pip install imagesize==1.4.1 отдельно.
- bitsandbytes==0.43.0 , prodigyopt==1.0 , lion-pytorch==0.0.6 включены в файл требований.txt.
  - bitsandbytes больше не требует сложных процедур, поскольку теперь официально поддерживает Windows.
- Также версия PyTorch обновляется до 2.1.2 (PyTorch не требует немедленного обновления). В процессе обновления PyTorch не обновляется, поэтому при необходимости установите или обновите torch, torchvision, xformers вручную (см. Обновление PyTorch).
Когда вход в wandb включен, отображается вся командная строка. Поэтому рекомендуется записать ключ API wandb и токен HuggingFace в файл конфигурации ( .toml ). Спасибо bghira за поднятие проблемы.
- Предупреждение отображается в начале обучения, если такая информация включена в командную строку.
- Кроме того, если существует абсолютный путь, он может быть открыт, поэтому рекомендуется указать относительный путь или записать его в файл конфигурации. В таких случаях отображается журнал INFO.
- Подробности см. в № 1123 и PR № 1240.
Colab, похоже, остановил вывод журнала. Попробуйте указать опцию --console_log_simple в сценарии обучения, чтобы отключить расширенное ведение журнала.
Другие улучшения включают добавление маскированной потери, запланированной потери Huber, поддержку DeepSpeed, улучшения настроек набора данных и улучшения маркировки изображений. Подробности см. ниже.

Скрипты обучения

train_network.py и sdxl_train_network.py изменены для записи некоторых настроек набора данных в метаданные обученной модели ( caption_prefix , caption_suffix , keep_tokens_separator , secondary_separator , enable_wildcard ).
Исправлена ошибка, из-за которой U-Net и кодировщики текста включались в состояние в train_network.py и sdxl_train_network.py . Сохранение и загрузка состояния происходят быстрее, размер файла меньше, а использование памяти при загрузке уменьшается.
DeepSpeed поддерживается. PR № 1101 и № 1139 Спасибо BootsofLagrangian! Подробности см. в PR № 1101.
Маскированная потеря поддерживается в каждом сценарии обучения. PR № 1207 Подробности см. в разделе «Маскированные потери».
Запланированная потеря Хубера была введена в каждый сценарий обучения. PR #1228 Спасибо kabachuha за пиар и cheald, drhead и остальным за обсуждение! Подробности см. в PR и запланированных потерях Huber.
Опции --noise_offset_random_strength и --ip_noise_gamma_random_strength добавляются в каждый тренировочный скрипт. Эти параметры можно использовать для изменения смещения шума и гаммы IP-шума в диапазоне от 0 до указанного значения. PR №1177 Спасибо KohakuBlueleaf!
Опции --save_state_on_train_end добавляются в каждый сценарий обучения. PR #1168 Спасибо gesen2egee!
Параметры --sample_every_n_epochs и --sample_every_n_steps в каждом сценарии обучения теперь отображают предупреждение и игнорируют их, если указано число меньше или равное 0 . Спасибо S-Del за поднятие проблемы.

Настройки набора данных

Добавлена английская версия документации по настройкам набора данных. PR #1175 Спасибо darkstorm2150!
Файл .toml конфигурации набора данных теперь читается в кодировке UTF-8. PR #1167 Спасибо Horizon1704!
Исправлена ошибка, из-за которой последние настройки подмножества применялись ко всем изображениям, если в настройках набора данных указано несколько подмножеств изображений регуляризации. Настройки для каждого подмножества правильно применяются к каждому изображению. PR #1205 Спасибо feffy380!
Некоторые функции добавляются в настройки подмножества набора данных.
- secondary_separator добавляется для указания разделителя тегов, который не является целью перетасовки или удаления.
  - Укажите secondary_separator=";;;" . Когда вы указываете secondary_separator , часть не перемешивается и не отбрасывается.
- enable_wildcard добавлен. Если установлено значение true , можно использовать обозначение подстановочных знаков {aaa|bbb|ccc} . Многострочный заголовок также включен.
- keep_tokens_separator обновлен и теперь может использоваться в заголовке дважды. Когда вы указываете keep_tokens_separator="|||" , часть, разделенная на вторую ||| не перемешивается и не отбрасывается и остается в конце.
- Существующие функции caption_prefix и caption_suffix можно использовать вместе. caption_prefix и caption_suffix обрабатываются первыми, а затем по порядку обрабатываются enable_wildcard , keep_tokens_separator , перетасовка и удаление, а также secondary_separator .
- Подробности см. в разделе Конфигурация набора данных.
Набор данных с методом DreamBooth поддерживает кэширование информации об изображении (размер, подпись). PR № 1178 и № 1206 Спасибо KohakuBlueleaf! Подробности см. в разделе «Параметры метода DreamBooth».

Маркировка изображений

Поддержка репозиториев v3 добавлена в tag_image_by_wd14_tagger.py (только опция --onnx ). PR #1192 Спасибо sdbds!
- Возможно, Onnx необходимо обновить. Onnx не установлен по умолчанию, поэтому установите или обновите его с помощью pip install onnx==1.15.0 onnxruntime-gpu==1.17.1 и т. д. Также проверьте комментарии в файле requirements.txt .
Модель теперь сохраняется в подкаталоге как --repo_id в tag_image_by_wd14_tagger.py . Это кэширует несколько моделей repo_id. Пожалуйста, удалите ненужные файлы в --model_dir .
Некоторые параметры добавлены в tag_image_by_wd14_tagger.py .
- Некоторые из них добавлены в PR #1216. Спасибо Disty0!
- Вывод тегов рейтинга --use_rating_tags и --use_rating_tags_as_last_tag
- Сначала выводить теги символов --character_tags_first
- Развернуть теги и серии символов --character_tag_expand
- Укажите теги для вывода первыми --always_first_tags
- Заменить теги --tag_replacement
- Подробности см. в документации по тегам.
Исправлена ошибка при указании --beam_search и значении 2 или более для --num_beams в make_captions.py .

О маскированной потере

Маскированная потеря поддерживается в каждом сценарии обучения. Чтобы включить маскированную потерю, укажите опцию --masked_loss .

Функция не полностью протестирована, поэтому могут быть ошибки. Если вы обнаружите какие-либо проблемы, пожалуйста, откройте вопрос.

Набор данных ControlNet используется для указания маски. Изображения маски должны быть изображениями RGB. Значение пикселя 255 в канале R рассматривается как маска (потери рассчитываются только для пикселей с маской), а значение 0 рассматривается как не-маска. Значения пикселей 0–255 преобразуются в 0–1 (т. е. значение пикселя 128 рассматривается как половина веса потери). Подробности спецификации набора данных см. в документации LLLite.

О запланированной потере Huber

Запланированная потеря Хубера была введена в каждый сценарий обучения. Это метод повышения устойчивости к выбросам или аномалиям (повреждению данных) в обучающих данных.

При использовании традиционной функции потерь MSE (L2) влияние выбросов может быть значительным, что потенциально может привести к ухудшению качества создаваемых изображений. С другой стороны, хотя функция потерь Хубера может подавлять влияние выбросов, она имеет тенденцию ухудшать воспроизведение мелких деталей на изображениях.

Чтобы решить эту проблему, предлагаемый метод использует хитроумное применение функции потерь Хубера. Планируя использование потерь Хубера на ранних этапах обучения (при высоком уровне шума) и MSE на более поздних этапах, достигается баланс между устойчивостью к выбросам и воспроизведением мелких деталей.

Экспериментальные результаты подтвердили, что этот метод обеспечивает более высокую точность данных, содержащих выбросы, по сравнению с чистыми потерями Хубера или MSE. Увеличение вычислительных затрат минимально.

Недавно добавленные аргументы loss_type, Huber_schedule и Huber_c позволяют выбирать тип функции потерь (Huber, Smooth L1, MSE), метод планирования (экспоненциальный, постоянный, SNR) и параметр Хубера. Это обеспечивает оптимизацию на основе характеристик набора данных.

Подробности см. в PR № 1228.

loss_type : укажите тип функции потерь. Выберите huber для потерь Huber, smooth_l1 для плавных потерь L1 и l2 для потерь MSE. По умолчанию используется l2 , то же самое, что и раньше.
huber_schedule : укажите метод планирования. Выберите exponential , constant или snr . По умолчанию — snr .
huber_c : укажите параметр Huber. Значение по умолчанию — 0.1 .

Пожалуйста, прочтите «Релизы», чтобы узнать о последних обновлениях.

主要な変更点

依存ライブラリが更新されました。アップグレードを参照しライブラリを更新してください。
- Установите imagesize в формате pip install imagesize==1.4.1で個別にインストールしてください。
- bitsandbytes==0.43.0 , prodigyopt==1.0 , lion-pytorch==0.0.6 , require.txt に含まれるようになりました。
  - bitsandbytesが公式に Windows をサポートしたため複雑な手順が不要になりました。
- Версия PyTorch のバージョンを 2.1.2 Версия PyTorchはすぐに更新する必要はありません。更新時は、アップグレードの手順では PyTorchが更新されませんので、torch、torchvision、xformers を手動でインストールしてください。
вандбへのログ出力が有効の場合、コマンドライン全体が公開されます。そのため、コマンドラインにwandb の API キーや HuggingFace のトークンなどが含まれる場合、設定ファイル（ .toml ）への記載をお勧めします。問題提起していただいた bghira 氏に感謝します。
- このような場合には学習開始時に警告が表示されます。
- また絶対パスの指定がある場合、そのパスが公開される可能性がありますので、相対パスを指定するか設定ファイルに記載することをお勧めします。このような場合はINFO ログが表示されます。
- 詳細は #1123 および PR #1240 をご覧ください。
Колабでの動作時、ログ出力で停止してしまうようです。学習スクリプトに--console_log_simpleオプションを指定し、richのロギングを無効してお試しください。
その他、マスクロス追加、Запланированная потеря Хубера、、DeepSpeed対応、データセット設定の改善、画像タグ付けの改善などがあります。詳細は以下をご覧ください。

学習スクリプト

train_network.pyおよびsdxl_train_network.pyで、学習したモデルのメタデータに一部のデータセット設定が記録されるよう修正しました（ caption_prefix 、 caption_suffix 、 keep_tokens_separator 、 secondary_separator 、 enable_wildcard ）。
train_network.pyおよびsdxl_train_network.pyで、state に U-Net および Text Encoder が含まれる不具合を修正しました。stateの保存、読み込みが高速化され、ファイルサイズも小さくなり、また読み込み時のメモリ使用量も削減されます。
DeepSpeed がサポートされました。PR #1101 、#1139 BootsofLagrangian 氏に感謝します。詳細は PR #1101をご覧ください。
各学習スクリプトでマスクロスをサポートしました。PR #1207 詳細はマスクロスについてをご覧ください。
各学習スクリプトに Запланированная потеря Хубера を追加しました。PR #1228 ご提案いただいた кабачуха氏、および議論を深めてくださった cheald 氏、drhead氏を始めとする諸氏に感謝します。詳細は当該 PR および Scheduled Huber Loss についてをご覧ください。
各学習スクリプトに、noise offset、IP-шумовая гаммаを、それぞれ0~指定した値の範囲で変動させるオプション--noise_offset_random_strengthおよび--ip_noise_gamma_random_strengthが追加されました。 PR № 1177 KohakuBlueleaf 氏に感謝します。
各学習スクリプトに、学習終了時に состояниеを保存する--save_state_on_train_endオプションが追加されました。 PR #1168 gesen2egee 氏に感謝します。
各学習スクリプトで--sample_every_n_epochsおよび--sample_every_n_stepsオプションに0以下の数値を指定した時、警告を表示するとともにそれらを無視するよう変更しました。問題提起していただいたS-Del 氏に感謝します。

データセット設定

Кодировка .toml -8 で読み込まれるようになりました。PR #1167 Horizon1704氏に感謝します。
データセット設定で、正則化画像のサブセットを複数指定した時、最後のサブセットの各種設定がすべてのサブセットの画像に適用される不具合が修正されました。それぞれのサブセットの設定が、それぞれの画像に正しく適用されます。PR #1205 feffy380 氏に感謝します。
データセットのサブセット設定にいくつかの機能を追加しました。
- シャッフルの対象とならないタグ分割識別子の指定secondary_separatorを追加しました。 secondary_separator=";;;"のように指定します。 secondary_separatorで区切ることで、その部分はシャッフル、drop時にまとめて扱われます。
- enable_wildcardを追加しました。 trueにするとワイルドカード記法{aaa|bbb|ccc}が使えます。また複数行キャプションも有効になります。
- keep_tokens_separatorをキャプション内に 2つ使えるようにしました。たとえばkeep_tokens_separator="|||"と指定したとき、 1girl, hatsune miku, vocaloid ||| stage, mic ||| best quality, rating: general |||されず末尾に残ります。
- 既存の機能caption_prefixとcaption_suffixとあわせて使えます。 caption_prefixとcaption_suffixは一番最初に処理され、その後、ワイルドカード、 keep_tokens_separator 、シャッフルおよび drop、 secondary_separatorの順に処理されます。
- 詳細はデータセット設定をご覧ください。
DreamBooth 方式の DataSetで画像情報（サイズ、キャプション）をキャッシュする機能が追加されました。PR #1178、#1206 KohakuBlueleaf 氏に感謝します。詳細はデータセット設定をご覧ください。
データセット設定の英語版ドキュメントが追加されました。PR #1175 darkstorm2150氏に感謝します。

画像のタグ付け

tag_image_by_wd14_tagger.pyで v3 のリポジトリがサポートされました（ --onnx指定時のみ有効）。 PR #1192 sdbds氏に感謝します。
- Onnx のバージョンアップが必要になるかもしれません。デフォルトでは Onnx pip install onnx==1.15.0 onnxruntime-gpu==1.17.1等でインストール、アップデートしてください。 requirements.txtのコメントもあわせてご確認ください。
tag_image_by_wd14_tagger.pyで、モデルを--repo_idのサブディレクトリに保存するようにしました。これにより複数のモデルファイルがキャッシュされます。 --model_dir直下の不要なファイルは削除願います。
tag_image_by_wd14_tagger.pyにいくつかのオプションを追加しました。
- 一部は PR #1216 で追加されました。Disty0 氏に感謝します。
- レーティングタグを出力する--use_rating_tagsおよび--use_rating_tags_as_last_tag
- キャラクタタグを最初に出力する--character_tags_first
- キャラクタタグとシリーズを展開する--character_tag_expand
- 常に最初に出力するタグを指定する--always_first_tags
- タグを置換する--tag_replacement
- 詳細はタグ付けに関するドキュメントをご覧ください。
make_captions.pyで--beam_searchを指定し--num_beamsに2以上の値を指定した時のエラーを修正しました。

マスクロスについて

各学習スクリプトでマスクロスをサポートしました。マスクロスを有効にするには--masked_lossオプションを指定してください。

Проблемаを立てていただけると助かります。

マスクの指定には ControlNet или RGB画像である必要があります。R チャンネルのピクセル値 255 がロス計算対象、0がロス計算対象外になります。0-255 の値は、0-1の範囲に変換されます（つまりピクセル値 128 LLLite ドキュメントをご覧ください。

Запланированная потеря Хубера について

Данные коррупция）への耐性を高めるための手法、Запланированная потеря Хубераが導入されました。

従来のMSE（L2）損失関数では、異常値の影響を大きく受けてしまい、生成画像の品質低下を招く恐れがありました。一方、Huber損失関数は異常値の影響を抑えられますが、画像の細部再現性が損なわれがちでした。

この手法ではHuber損失関数の適用を工夫し、学習の初期段階（ノイズが大きい場合）ではHuber損失を、後期段階ではMSEを用いるようスケジューリングすることで、異常値耐性と細部再現性のバランスを取ります。

実験の結果では、この手法が純粋なHuber 損失やMSEと比べ、異常値を含むデータでより高い精度を達成することが確認されています。また計算コストの増加はわずかです。

具体的には、新たに追加された引数loss_type、huber_schedule、huber_cで、損失関数の種類（Huber, Smooth L1, MSE）とスケジューリング方法（экспоненциальный, постоянный, SNR).

詳細は PR #1228 をご覧ください。

loss_type : 損失関数の種類を指定します。 huberで Huber損失、 smooth_l1で Smooth L1 損失、 l2で MSE損失を選択します。デフォルトはl2で、従来と同様です。
huber_schedule : Экспоненциальный показатель, exponential , константа constant snrで信号対雑音比に基づくスケジューリングを選択します。デフォルトはsnrです。
huber_c : Huber 損失のパラメータを指定します。デフォルトは0.1です。

PR 内でいくつかの比較が共有されています。この機能を試す場合、最初は--loss_type smooth_l1 --huber_schedule snr --huber_c 0.1などで試してみるとよいかもしれません。

最近の更新情報は Release をご覧ください。

Дополнительная информация

Именование LoRA

LoRA, поддерживаемый train_network.py , назван во избежание путаницы. Документация обновлена. Ниже приведены имена типов LoRA в этом репозитории.

LoRA -LierLa : (LoRA для линейных слоев )
LoRA для линейных слоев и слоев Conv2d с ядром 1x1
LoRA-C3Lier : ( LoRA для вычислительных слоев с ядром 3 x3 и линейными слоями )
В дополнение к 1. LoRA для слоев Conv2d с ядром 3x3.

LoRA-LierLa — это тип LoRA по умолчанию для train_network.py (без сетевого аргумента conv_dim ).

Генерация образца изображения во время обучения

Файл подсказки может выглядеть, например, так:

 # prompt 1
masterpiece, best quality, (1girl), in white shirts, upper body, looking at viewer, simple background --n low quality, worst quality, bad anatomy,bad composition, poor, low effort --w 768 --h 768 --d 1 --l 7.5 --s 28

# prompt 2
masterpiece, best quality, 1boy, in business suit, standing at street, looking back --n (low quality, worst quality), bad anatomy,bad composition, poor, low effort --w 576 --h 832 --d 2 --l 5.5 --s 40

Строки, начинающиеся с # являются комментариями. Вы можете указать параметры сгенерированного изображения с помощью таких параметров, как --n после запроса. Можно использовать следующее.

--n Отрицательное приглашение к следующему варианту.
--w Определяет ширину создаваемого изображения.
--h Указывает высоту создаваемого изображения.
--d Указывает начальное значение сгенерированного изображения.
--l Указывает масштаб CFG сгенерированного изображения.
--s Указывает количество шагов в генерации.

Оперативные взвешивания, такие как ( ) и [ ] работают.

Расширять

Дополнительная информация

Версия Version 0.8.7
Тип Другой исходный код
Время обновления 2024-11-19
размер 50MB
От Github

Связанные приложения

adobe illustrator scripts

2024-11-11
Microsoft Activation Scripts

2024-11-06
СД горничная

2024-04-10
Бесплатная версия приложения SD-видео

2024-01-09
SD-приложение для электрической сваи

2023-08-01
Небесное Чистилище СД

2023-06-13