StableDiffusionEndToEndGuide 다운로드 - StableDiffusionEndToEndGuide 소스 코드 다운로드

StableDiffusionEndToEndGuide

기타 소스코드

1.0.0

다운로드

안정적인 확산 엔드투엔드 가이드 - 초보부터 전문가까지

저는 SD를 사용하여 군사용 이미지를 생성하는 데 관심을 갖게 되었습니다. Anons는 SD를 사용하여 헨타이를 만들기 때문에 대부분의 리소스는 4chan의 NSFW 보드에서 가져옵니다. 흥미롭게도 표준 SD WebUI에는 애니메이션/헨타이 이미지 보드와 함께 기능이 내장되어 있습니다. DALL-E가 애니메이션 소녀를 생성한 직후 SD의 첫 번째 사용 사례 중 하나이므로 헨타이로의 도약은 놀라운 일이 아닙니다.

어쨌든, 이 이상한 사람들의 기술은 다양한 애플리케이션, 특히 모델 미세 조정기와 같은 LoRA에 적용 가능합니다. 아이디어는 특정 LoRA(예: 군용 차량, 항공기, 무기 등)를 사용하여 비전 모델 훈련을 위한 합성 이미지 데이터를 생성하는 것입니다. 새롭고 유용한 LoRA를 훈련하는 것도 흥미롭습니다. 나중에는 교란을 위한 인페인팅이 포함될 수 있습니다.

면책조항 및 출처

Every link here may contain NSFW content, as most of the cutting-edge work on SD and LoRAs is with porn or hentai. So, please be wary when you are working with these resources. ALSO, Rentry.org pages are the main resources linked to in this guide. If any of the rentry pages do not work, change the .org to .co and the link should work. Otherwise, use the Wayback machine.

-TP

그것을 가지고 놀아 라!

실제로 SD로 무엇을 할 수 있나요? Huggingface와 일부 다른 앱에는 브라우저에 몇 가지 앱이 있습니다. 힘을 확인하기 위해 그들과 함께 놀아보세요! 이 가이드에서 우리가 할 일은 우리가 원하는 모든 것을 할 수 있도록 완전하고 확장 가능한 WebUI를 얻는 것입니다.

허깅페이스 텍스트를 이미지 SD 놀이터로
Dreamstudio 텍스트를 이미지 SD 앱으로 변환
Dezgo 텍스트를 이미지 SD 앱으로 변환
포옹 얼굴 이미지를 이미지 SD 놀이터로
허깅페이스 인페인팅 놀이터

WebUI 기본
1. 로컬 GPU 사용량 설정
  1. 리눅스 설정
2. 더 깊게
  1. 격려
3. NovelAI 모델
4. 로라
5. 모델과 놀기
6. VAE
7. 모두 함께 넣어
  1. 일반 SD 프로세스
  2. 프롬프트 저장
  3. txt2img 설정
  4. 이전에 생성된 이미지 재생성
  5. 오류 문제 해결
8. 편안해지기
9. 테스트
WebUI 고급
1. 프롬프트 편집
2. Xformers
3. Img2Img
4. 인페인팅
5. 엑스트라
6. 컨트롤넷
7. 새로운 물건 만들기 (WIP)
  1. 체크포인트 합병
  2. LoRA 훈련
  3. 새로운 모델 훈련
Google Colab 설정(WIP)
중간 여정
1. 엠제이 매개변수
2. MJ 고급 프롬프트
드림스튜디오(WIP)
마구간 호드(WIP)
드림부스(WIP)
비디오 확산(WIP)

WebUI 기본

이 작업을 시작하는 것은 다소 어려운 일이지만... 4channers는 이 작업을 접근하기 쉽게 만드는 데 훌륭한 역할을 했습니다. 다음은 제가 취한 단계를 가장 간단한 용어로 설명합니다. 귀하의 의도는 Stable Diffusion WebUI(Gradio로 구축)를 로컬에서 실행하여 메시지를 표시하고 이미지 만들기를 시작할 수 있도록 하는 것입니다.

로컬 GPU 사용량 설정

나중에 Google Colab Pro 설정을 수행하여 원하는 모든 장치에서 SD를 실행할 수 있습니다. 하지만 시작하려면 PC에서 WebUI를 설정해 보겠습니다. 16GB RAM, 2GB VRAM이 있는 GPU, Windows 7 이상 및 20GB 이상의 디스크 공간이 필요합니다.

시작 설정 가이드 완료
- 나는 이것을 7단계까지 따라갔고, 그 후에는 헨타이 항목으로 들어갔습니다.
- 모델이 각각 5GB 이상이므로 3단계는 평균 인터넷 속도로 15~45분 정도 걸립니다.
- 7단계는 30분 이상 걸릴 수 있으며 CLI에서 "멈춘" 것처럼 보일 수 있습니다.
- 3단계에서는 2.x 버전이 아닌 SD1.5를 다운로드했습니다. 1.5가 훨씬 더 나은 결과를 생성하기 때문입니다.
- CivitAI에는 모든 SD 모델이 있습니다. HuggingFace와 비슷하지만 특히 SD용입니다.
WebUI가 작동하는지 확인
1. 완료되면 CLI 출력 URL을 복사합니다(예: 127.0.0.1:7860 (이 명령은 CLI를 닫을 수 있으므로 Ctrl + C를 사용 하지 마십시오 ).
2. 브라우저에 붙여넣으면 짜잔; 프롬프트를 시도하면 경주를 시작하게 됩니다.
3. 이미지는 생성되면 stable-diffusion-webuioutputstxt2img-images<date> 에 자동으로 저장됩니다.
업데이트하려면 stable-diffusion-webui 폴더에서 CLI를 열고 git pull 명령을 입력하세요.

리눅스 설정

Windows를 사용하는 경우에는 이를 완전히 무시하세요. 좀 더 복잡하긴 하지만 Linux에서도 실행할 수 있었습니다. 나는 이 가이드를 따라 시작했지만 다소 형편없게 작성되었으므로 Linux에서 실행하기 위해 취한 단계는 다음과 같습니다. 저는 Ubuntu 20 배포판인 Linux Mint 20을 사용하고 있었습니다.

webui 저장소를 복제하여 시작하십시오. git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
SD 모델 가져오기(예: 이전 섹션과 마찬가지로 SD 1.5)
모델 ckpt 파일을 stable-diffusion-webui/models/Stable-diffusion 에 넣습니다.
Python 다운로드(아직 없는 경우): sudo apt install python3 python3-pip python3-virtualenv wget git
그리고 WebUI는 매우 특별하므로 다음 내부에서 작업하려면 가상 환경 관리자인 Conda를 설치해야 합니다.

 wget https://repo.anaconda.com/miniconda/Minconda3-latest-Linux-x86_64.sh
chmod +x Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

이제 환경을 생성하십시오: conda create --name sdwebui python=3.10.6
환경 활성화: conda activate sdwebui
WebUI 폴더로 이동하여 ./webui.sh 입력하세요.
CUDA/GPU에 액세스할 수 없다는 오류가 발생할 때까지 잠시 동안 실행되어야 합니다. 다음 단계이므로 괜찮습니다.
기존 Nvidia 드라이버를 지우는 것부터 시작하세요.

 sudo apt update
sudo apt purge *nvidia*

이제 이 가이드의 일부 내용을 따라 Linux 시스템에 어떤 GPU가 있는지 알아보세요. 가장 쉬운 방법은 드라이버 관리자 앱을 여는 것이며 GPU가 나열되지만 12가지 방법이 있습니다. Google에서 검색해 보세요.
이 페이지로 이동하여 Linux x86_64에서 "Latest New Feature Branch"를 클릭하세요(저에게는 530.xx.xx였습니다).
GPU를 찾으려면 "지원되는 제품" 탭을 클릭하고 Ctrl + F를 클릭하세요. 목록에 있으면 계속 진행하고, 그렇지 않으면 취소하고 "최신 프로덕션 분기 버전"을 시도하십시오. 숫자를 기록해 두세요(예: 530).
터미널에 다음을 입력하세요: sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update 로 업데이트
Driver Manager 앱을 실행하면 해당 앱의 목록이 표시됩니다. 권장되는 것(예: nvidia-driver-530-open)을 선택하지 말고 이전의 것과 동일한 것(예: nvidia-driver-530)을 선택한 다음 변경 사항을 적용하십시오. 또는 sudo apt-get install nvidia-driver-530 사용하여 터미널에 설치합니다.
이 시점에서 CLI를 통해 보안 부팅에 대한 팝업이 표시되어 8자리 비밀번호를 묻는 메시지가 표시됩니다. 비밀번호를 설정하고 적어 두세요.
PC를 재부팅하고 암호화/사용자 로그인 전에 MOK 키를 입력할 수 있는 옵션이 있는 BIOS와 유사한 화면(메모리에서 작성 중입니다)이 표시되어야 합니다. 그것을 클릭하고 비밀번호를 입력한 다음 제출하고 부팅하십시오. 여기 정보 좀요
평소와 같이 로그인하고 nvidia-smi 명령을 입력하십시오. 성공하면 테이블이 인쇄됩니다. 그렇지 않은 경우 "GPU에 연결할 수 없습니다. 최신 드라이버가 설치되어 있는지 확인하십시오"와 같은 메시지가 표시됩니다.
이제 CUDA를 설치합니다(여기서 마지막 명령은 새 CUDA 설치에 대한 일부 정보를 인쇄해야 합니다). 이 가이드에서:

 sudo apt update
sudo apt install apt-transport-https ca-certificates gnupg
sudo apt install nvidia-cuda-toolkit
nvcc-version

이제 돌아가서 7~9단계를 수행하세요. "오류: Python venv를 활성화할 수 없습니다. 중단 중..."이라는 메시지가 표시되면 다음 단계로 이동하세요.
이 Github 문제에는 이 venv 문제에 대한 몇 가지 문제 해결 방법이 있습니다... 저에게는 효과가 있었던 것이 실행 중이었습니다.

 python3 -c 'import venv'
python3 -m venv venv/

그런 다음 /stable-diffusion-webui 폴더로 이동하여 다음을 실행합니다.

 rm -rf venv/
python3 -m venv venv/

그 후에 그것은 나에게 효과적이었습니다.

더 깊게

알아야 할 사항이 많기 때문에 프롬프트 기술을 읽어보세요(예: 긍정적 프롬프트 대 부정적 프롬프트, 샘플링 단계, 샘플링 방법 등).
- OpenArt 프롬프트북 가이드
- 확실한 SD 프롬프트 가이드
- 간결한 안내 가이드
- 4chan 프롬프트 팁(NSFW)
- 프롬프트 및 이미지 모음
- 단계별 애니메이션 소녀 안내 안내
일반적인 SD 지식을 읽어보세요.
- 정액 안정 확산 출판물
- CompVis / Stability AI Github(원래 SD 모델의 홈)
- 안정 확산 개론(좋은 외부 자원)
- 안정적인 확산 링크 허브(놀라운 4chan 리소스)
- 안정 확산 금광
- 단순화된 SD 금광
- 무작위/기타 SD 링크
- FAQ(NSFW)
- 또 다른 FAQ
안정확산 디스코드에 참여하세요
Stable Diffsion 뉴스를 최신 상태로 유지하세요.
- 2023년 3월 기준으로 1.7B 매개변수의 텍스트-비디오 확산 모델을 사용할 수 있다는 사실을 알고 계셨나요?
WebUI를 조작하고 다양한 모델, 설정 등을 사용해 보세요.

격려

프롬프트의 단어 순서는 영향을 미칩니다. 이전 단어가 우선 적용됩니다. 좋은 프롬프트의 일반적인 구조는 다음과 같습니다.

<general positives> <descriptors of subject> <descriptors of background> <post-processing, camera, etc.>

또 다른 좋은 가이드에서는 프롬프트가 다음 구조를 따라야 한다고 말합니다.

<subject> <medium> <style> <artist> <website> <resolution> <additional details> <color> <lighting>

프롬프트 엔지니어링 txt2img 모델에 대한 중요한 논문은 여기를 참조하세요. LLM 프롬프트에 대한 최종 리소스는 여기입니다.

무엇을 요청하든 프로세스가 복제 가능하도록 일종의 구조를 따르도록 노력하십시오. 다음은 필요한 프롬프트 구문 요소입니다.

() = x1.05 수정자
[] = /1.05 수정자
(단어:1.05) == (단어)
(단어:1.1025) == ((단어))
(단어:.952) == [단어]
(단어:.907) == [[단어]]
AND 키워드를 사용하면 한 번에 두 개의 별도 프롬프트를 표시하여 병합할 수 있습니다. 좋습니다. 그러면 잠재 공간에서 사물이 서로 뭉개지지 않습니다.
- 예: 1girl standing on grass in front of castle AND castle in background

NovelAI 모델

기본 모델은 매우 깔끔하지만 역사상 일반적으로 그렇듯이 섹스가 대부분의 일을 주도합니다. NovelAI(NAI)는 애니메이션 중심의 SD 콘텐츠 생성 서비스로, 주요 모델이 유출되었습니다. 당신이 보는 애니메이션 남성과 여성의 SD 생성 이미지(NSFW 여부에 관계없이)의 대부분은 이 유출된 모델에서 나온 것입니다.

어쨌든 사람을 생성하는 데는 정말 효과적이며 병합을 통해 플레이할 대부분의 모델이나 LoRA는 애니메이션 이미지에 대해 교육을 받았기 때문에 호환됩니다. 또한 인간은 전문적인 목적으로 사용하려는 LoRA를 정확히 미세 조정하기 위한 정말 좋은 시작 사용 사례를 제시합니다. 문제 해결을 많이 하게 될 것이며 대부분의 가이드는 여성 이미지에 대한 것입니다. 나중에 모델에 진정한 사실성을 부여하는 VAE(가변 자동 인코더)에 대해 살펴보겠습니다.

NovelAI Speedrun 가이드를 따르세요.
- 유출된 모델을 토렌트하거나 다른 곳에서 찾아야 합니다.
WebUI용 폴더 stable-diffusion-webuimodelsStable-diffusion 에 파일을 가져오고 거기에서 모델을 선택하면 CLI가 VAE 가중치를 로드하는 동안 몇 분 정도 기다려야 합니다.
- 여기서 문제가 발생하면 모델이 있던 폴더에서 config.yaml 파일을 복사하고 동일한 명명 체계를 따르세요(이 가이드 참조).
이게 중요해요... 일치하지 않을 경우 문제 해결 가이드를 참조하여 아스카 이미지를 정확하게 다시 생성하세요.
새로운 SD 모델 및 LoRA 찾기
- CivitAI
- 포옹하는 얼굴
- SDG 모델
- SDG 모델 마더로드(NSFW)
- SDG LoRA 마더로드(NSFW)
- 많은 인기 모델(또한 이전의 프롬프트 가이드)(NSFW)

로라

LoRA(Low-Rank Adaptation)를 사용하면 특정 모델에 대한 미세 조정이 가능합니다. LoRA에 대한 자세한 내용은 여기를 참조하세요. WebUI에서는 케이크 위에 아이싱을 장식하는 것처럼 모델에 LoRA를 추가할 수 있습니다. 새로운 LoRA를 훈련시키는 것도 꽤 쉽습니다. 미세 조정을 위한 다른 "전통" 수단(예: 텍스트 반전 및 하이퍼네트워크)이 있지만 LoRA는 최첨단입니다.

ZTZ99A 탱크 - 군용 탱크 LoRA(특정 탱크)
전투기 - 전투기 LoRA
epi_noiseoffset - 이미지를 돋보이게 하고 대비를 높이는 LoRA

가이드 전반에 걸쳐 탱크 LoRA를 사용하겠습니다. 애니메이션 스타일의 이미지를 위한 것이므로 그다지 좋은 LoRA는 아니지만 가지고 놀기에는 괜찮습니다.

확장 프로그램을 설치하려면 이 빠른 가이드를 따르세요.
이제 UI에 '추가 네트워크' 섹션이 표시됩니다.
LoRA를 stable-diffusion-webuiextensionssd-webui-additional-networksmodelslora 에 넣으세요.
선택하고 이동하세요
- '활성화'를 확인하세요.
- 다운로드한 LoRA에는 사용 방법을 설명하는 정보가 있을 수 있습니다. 예를 들어 "탱크 키워드 사용"과 같은 정보가 있을 수 있습니다. 어디에서 다운로드하든(예: CivitAI) 설명을 읽으십시오.

모델과 놀기

이전 섹션을 기반으로 하면... 모델마다 훈련 데이터와 훈련 키워드가 다르기 때문에 일부 모델에서는 booru 태그를 사용하는 것이 잘 작동하지 않습니다. 다음은 제가 가지고 놀았던 일부 모델과 해당 모델에 대한 "지침"입니다.

대부분의 모델을 가져오는 데 사용되는 SDG 모델 마더로드는 빠른 참조를 위해 여기에 지침을 요약하고 있습니다. 대부분의 모델은 실제 포르노를 위한 것이므로 저는 현실적인 모델에 중점을 두었습니다. 링크를 따라가면 각 사용법에 대한 예제 프롬프트, 이미지 및 자세한 참고 사항을 볼 수 있습니다.

기본 SD 모델(설정 단계에서 1.5, SD의 2.x 버전으로 플레이할 수 있지만 솔직히 말해서 형편없습니다)
NovelAI 모델(첫 번째 가이드에서)
Anything v3 - 범용 애니메이션 모델
Dreamshaper - 사실주의, 다목적
의도적 - 사실주의, 환상, 회화, 풍경
Neverending Dream - 사실주의, 판타지, 사람과 동물에게 좋음
- 부루 태그 시스템을 사용합니다.
Epic Diffusion - 원본 SD를 대체하기 위한 초현실주의
AbyssOrangeMix(AOM) - 애니메이션, 사실주의, 예술, 그림, 매우 일반적이며 테스트에 적합합니다.
Kotosmix - 범용, 사실주의, 애니메이션, 풍경, 인물, DPM++ 2M Karras 샘플러 권장

CivitAI는 다른 모든 것을 얻는 데 사용되었습니다. 계정을 만들어야 합니다. 그렇지 않으면 무기 및 군사 장비를 포함한 NSFW 항목을 볼 수 없습니다. CivitAI에서는 일부 모델(체크포인트)에 VAE가 포함되어 있습니다. 이에 관한 내용이 있으면 다운로드하여 모델 옆에 배치하십시오.

ChilloutMix - 초현실주의 인물 사진, 가장 인기 있는 사진 중 하나
Protogen x3.4 - 초현실주의
- 트리거 단어 사용: modelshoot 스타일, 아날로그 스타일, mdjrny-v4-style, nousr 로봇
Dreamlike Photoreal 2.0 - 초현실주의
- 유발 단어 사용: 사실적
디지털 아티스트를 위한 SPYBG 툴킷 - 사실주의, 컨셉 아트
- 트리거 단어 사용: tk-char, tk-env

VAE

가변 자동 인코더는 이미지를 더 좋게, 또렷하게, 덜 깨뜨려 보이게 만듭니다. 일부는 손과 얼굴을 고치기도 합니다. 그러나 그것은 대부분 채도와 음영입니다. 여기와 여기(NSFW)에 설명되어 있습니다. NovelAI/Anything VAE가 일반적으로 사용됩니다. 기본적으로 LoRA와 마찬가지로 모델에 추가되는 기능입니다.

VAE 목록에서 VAE를 찾으세요.

NAI / Anything - 애니메이션 모델용
- 모델 폴더에 넣으면 기본적으로 NAI 모델이 함께 제공됩니다.
SD 1.5 - 현실적인 모델용

VAE 다운로드
WebUI에서 VAE를 설정하려면 가이드의 이 빠른 섹션을 따르세요.
- stable-diffusion-webuimodelsVAE 에 넣어야 합니다.
VAE를 사용하거나 사용하지 않고 이미지를 만들어 보면서 차이점을 확인하세요.

모두 함께 넣어

다음은 이 가이드의 연대순 흐름에 반드시 맞지는 않지만 제가 배운 몇 가지 일반적인 참고 사항과 유용한 사항입니다.

일반 SD 프로세스

학습하는 좋은 방법은 CivitAI, AIbooru 또는 기타 SD 사이트(4chan, Reddit 등)에서 멋진 이미지를 찾아보고 원하는 것을 열고 생성 매개변수를 WebUI에 복사하는 것입니다. 전체 공개: 여기에 설명된 대로 이미지를 정확하게 다시 만드는 것이 항상 가능한 것은 아닙니다. 그러나 일반적으로 꽤 가까워질 수 있습니다. 실제로 실험해 보려면 CFG를 낮게 설정하여 모델이 더욱 창의적이 되도록 하세요. 배치를 시도하고 컴퓨터에서 벗어나 로트에 돌아와서 선택하세요.

WebUI 워크플로의 일반적인 프로세스는 다음과 같습니다.

find/pick models/LoRAs -> txt2img (repeat, change params, etc.) -> img2img -> inpainting -> extra ->

txt2img - 프롬프트 표시 및 이미지 가져오기
img2img - 이미지 편집 및 유사한 이미지 생성
인페인팅 - 이미지의 일부 편집(나중에 설명)
추가 - 최종 이미지 편집(나중에 논의)

프롬프트 저장

때로는 이미지를 붙여넣거나 처음부터 작성하지 않고 프롬프트로 돌아가고 싶을 때가 있습니다. WebUI에서 재사용하기 위해 프롬프트를 저장할 수 있습니다.

긍정적이거나 부정적인 프롬프트를 작성하세요
생성 버튼 아래 오른쪽에 있는 버튼을 클릭하여 "스타일"을 저장하세요.
이름을 입력하고 저장하세요
스타일 드롭다운을 클릭하여 언제든지 선택하세요.

txt2img 설정

이 섹션은 이 가이드의 정보를 요약한 것입니다.

샘플링 단계가 많을수록 일반적으로 정확도가 높아집니다(자주 변경되는 오일러 a와 같은 "a" 샘플러 제외).
이것을 켜고 끄고 플레이하세요. 일반적으로 켜면 얼굴이 정말 좋아보이네요
고해상도. 수정은 512x512 이상의 이미지에 적합합니다. 이미지에 사람이 두 명 이상인 경우 유용합니다.
CFG는 5-10과 같은 중간 값에서 가장 좋습니다.

이전에 생성된 이미지 재생성

이미 존재하는 SD 생성 이미지에서 작업하려면 누군가가 당신에게 그것을 보냈거나 당신이 만든 것을 다시 만들고 싶을 수도 있습니다.

WebUI에서 PNG 정보 탭으로 이동합니다.
관심 있는 이미지를 UI에 드래그 앤 드롭하세요.
- stable-diffusion-webuioutputstxt2img-images<date> 에 저장됩니다.
오른쪽에서 사용된 매개변수를 확인하세요.
- PNG가 메타데이터를 저장할 수 있기 때문에 작동합니다.
해당 버튼을 사용하여 txt2img 페이지로 바로 보낼 수 있습니다
- 모델, VAE 및 기타 매개변수가 올바르게 자동으로 채워지는지 확인하기 위해 앞뒤로 확인해야 할 수도 있습니다.

일부 사이트에서는 이미지가 업로드될 때(예: 4chan) PNG 메타데이터를 제거하므로 전체 이미지에 대한 URL을 찾거나 CivitAI 또는 AIbooru와 같이 SD 메타데이터를 유지하는 사이트를 사용하십시오.

오류 문제 해결

가끔 몇 가지 오류가 발생했습니다. 대부분의 메모리 부족(VRAM) 오류는 일부 매개변수의 값을 낮춤으로써 해결되었습니다. 때로는 복원 얼굴과 고용. 설정 수정으로 인해 이 문제가 발생할 수 있습니다. stable-diffusion-webuiwebui-user.bat 파일의 set COMMANDLINE_ARGS= 줄에 일반적인 오류를 수정하는 몇 가지 플래그를 넣을 수 있습니다.

NaN 오류, "VAE가 NaN을 생성했습니다" 효과에 대해 --disable-nan-check 매개변수를 추가합니다.
검은색 이미지가 나타나면 --no-half 추가하세요.
VRAM이 계속 부족하면 --medvram 추가하거나 감자 컴퓨터의 경우 --lowvram 추가하세요.
얼굴 복원 Codeformer 수정 사항은 여기에서 확인하세요(깨지는 경우 먼저 인터넷을 재설정해 보세요).
느린 모델 로드(새 모델로 전환할 때)는 아마도 항목이 제대로 구성되지 않은 경우 .safetensors 파일이 느리게 로드되기 때문일 것입니다. 이 스레드에서는 이에 대해 논의합니다.

매우 일반적인 문제 중 하나는 잘못된 Python 버전이나 Torch 버전에서 비롯됩니다. "Torch를 설치할 수 없습니다" 또는 "Torch가 GPU를 찾을 수 없습니다"와 같은 오류가 발생합니다. 가장 간단한 수정은 다음과 같습니다.

SD WebUI는 3.10.6을 예상하므로 업데이트한 Python 버전을 제거합니다. (저는 3.11.5를 사용하고 시작 오류를 무시했지만 3.10.6이 가장 잘 작동하는 것 같습니다.) (필요한 경우 버전 관리자를 사용할 수도 있습니다. 충분히 발전했어요)
Python 3.10.6을 설치하고 PATH( Python 폴더와 Python/Scripts 폴더 모두)에 추가했는지 확인하세요.
stable-diffusion-webui 폴더에서 venv 폴더를 삭제하세요.
stable-diffusion-webuiwebui-user.bat 실행하고 venv를 올바르게 다시 빌드하도록 합니다.
즐기다

모든 명령줄 인수는 여기에서 찾을 수 있습니다.

편안해지기

일부 확장을 사용하면 WebUI를 더 효과적으로 사용할 수 있습니다. Github 링크를 받고 Extensions 탭으로 이동하여 URL에서 설치하세요. 선택적으로 확장 탭에서 사용 가능을 클릭한 다음 다음에서 로드를 클릭하면 확장을 로컬로 찾아볼 수 있습니다. 이는 확장 Github 위키를 미러링합니다.

태그 완성기 - 입력할 때 부루 태그를 추천하고 자동 완성합니다.
Stable Diffusion Web UI State - 재시작 후에도 UI 상태를 유지합니다.
내 프롬프트 테스트 - 프롬프트에서 개별 단어를 제거하여 이미지 생성에 어떤 영향을 미치는지 확인하기 위해 실행할 수 있는 스크립트입니다.
모델 키워드 - 일부 모델 및 LoRA와 관련된 키워드를 자동 완성하며, 2023년 4월 현재 잘 관리되고 최신 상태입니다.
NSFW 검사기 - NSFW 이미지를 검게 만듭니다. 많은 좋은 모델이 NSFW 콘텐츠를 허용하고 직장에서는 이를 보고 싶지 않을 수 있으므로 사무실에서 작업하는 경우 유용합니다.
- 주의하세요: 이 확장 프로그램은 NSFW 이미지를 검게 하여 인페인팅이나 심지어 생성까지 망칠 수 있으므로(일시적으로는 아니고 문자 그대로 검은색 이미지를 출력합니다) 필요에 따라 끄도록 하세요.
Gelbooru Prompt - 해시를 사용하여 Gelbooru 이미지에서 태그를 가져오고 자동 프롬프트를 생성합니다.
booru2prompt - Gelbooru Prompt와 유사하지만 기능이 조금 더 많습니다.
동적 프롬프트 - 무작위 또는 조합 프롬프트를 실행하여 다양한 이미지를 생성할 수 있는 프롬프트 생성용 템플릿 언어(와일드카드 사용)
- 여기에 좀 더 설명되어 있습니다.
모델 툴킷 - 모델을 관리, 편집 및 생성하는 데 도움이 되는 널리 사용되는 확장 기능
모델 변환기 - 자신을 훈련할 때 모델 변환, 정밀도 변경 등에 유용합니다.

테스트

이제 몇 가지 모델, LoRA 및 프롬프트가 있습니다. 무엇이 가장 효과적인지 확인하기 위해 어떻게 테스트할 수 있습니까? 추가 네트워크 창 아래에는 스크립트 드롭다운이 있습니다. 여기에서 X/Y/Z 플롯을 클릭합니다. X 유형에서 체크포인트 이름을 선택합니다. X 값에서 오른쪽에 있는 버튼을 클릭하여 모든 모델을 붙여넣습니다. Y 유형에서는 VAE, 시드 또는 CFG 스케일을 사용해 보세요. 어떤 속성을 선택하든 그래프로 표시하려는 값을 붙여넣거나 입력하세요. 예를 들어, 5개의 모델과 5개의 VAE가 있는 경우 25개의 이미지로 구성된 그리드를 만들어 각 모델이 각 VAE와 어떻게 출력되는지 비교합니다. 이는 매우 다양하며 무엇을 사용할지 결정하는 데 도움이 될 수 있습니다. X 또는 Y 축이 VAE 모델인 경우 모든 조합에 대해 모델 또는 VAE 가중치를 로드해야 하므로 시간이 걸릴 수 있습니다.

SD 비교에 대한 정말 좋은 리소스는 여기(NSFW)에서 찾을 수 있습니다. 따라야 할 링크가 많이 있습니다. 다양한 모델, VAE, LoRA, 매개변수 값 등이 이미지 생성에 어떤 영향을 미치는지에 대한 이해를 시작할 수 있습니다.

저는 여기에서 테스트 프롬프트를 채택하고 탱크 LoRA를 사용하여 이 X/Y 그리드를 만들었습니다. 다양한 모델과 샘플러가 서로 어떻게 작동하는지 확인할 수 있습니다. 이 테스트를 통해 다음을 평가할 수 있습니다.

ChilloutMix, Deliberate, Dreamlike Photoreal 및 Epic Diffusion 모델은 가장 "현실적인" 탱크 이미지를 생성하는 것으로 보입니다.
- 이후의 독립적인 테스트에서 Protogen X34 Photorealism과 SpyBGs Toolkit은 둘 다 탱크에서도 매우 뛰어난 것으로 나타났습니다.
여기서 가장 유망한 샘플러는 DPM++ SDE 또는 Karras 샘플러인 것 같습니다.

이러한 모든 탱크 이미지에 사용된 정확한 매개변수(모델이나 샘플러 제외)는 아래에 나와 있습니다(다시 여기에서 가져옴).

긍정적인 프롬프트: 탱크, bf2042, 최고 품질, 걸작, 초고해상도, (실사적: 1.4), 상세한 피부, 영화 같은 조명, 영화 같은 매우 상세한, 다채롭고 현대적인 사진, 전장의 군인 그룹, 전장 곳곳에서 폭발, 제트 전투기 하늘을 나는 헬리콥터, 지상에 탱크 2대, 사막 지역, 불타고 있는 건물, 배경에 버려진 군용 장갑차 1대
부정적인 프롬프트: 알몸, (최악 품질:2), (낮은 품질:2), (보통 품질:2), 낮은 해상도, 나쁜 해부학적 구조, 나쁜 손, 보통 품질, ((단색)), ((회색조)), 축소됨 아이섀도, 여러 개의 눈썹, 분홍색 머리, 가슴에 난 구멍, ng_deepnegative_v1_75t, nsfw, 젖꼭지,여분의 손가락, ((여분의 팔)), (다리 추가), 변형된 손, (융합된 손가락), (손가락이 너무 많음), (긴 목:1.3)
단계: 22
CFG 규모: 7.5
시드: 1656460887
크기: 480x480
클립 건너뛰기: 2
AddNet 활성화됨: True, AddNet 모듈 1: LoRA, AddNet 모델 1: ztz99ATank_ztz99ATank(82a1a1085b2b), AddNet 가중치 A 1: 1, AddNet 가중치 B 1: 1

WebUI 고급

이 섹션에서는 WebUI의 txt2image 탭에 있는 모델, LoRA, VAE, 프롬프트, 매개변수, 스크립팅 및 확장 사용에 익숙해지면 수행할 수 있는 고급 작업에 대해 설명합니다.

프롬프트 편집

프롬프트 블렌딩이라고도 합니다. 프롬프트 편집을 사용하면 모델이 지정된 단계에서 프롬프트를 변경하도록 할 수 있습니다. 아래 이미지는 4chan 게시물에서 가져온 것이며 기술을 설명합니다. 예를 들어, 이 가이드에 설명된 대로 신속한 편집을 사용하여 면을 혼합할 수 있습니다.

Xformers

Xformers 또는 교차 관심 레이어. Nvidia GPU에서 이미지 생성 속도(초/반복 또는 s/it로 측정)를 높이는 방법은 VRAM 사용량을 낮추지만 비결정성을 유발합니다. 강력한 GPU가 있는 경우에만 이것을 고려하십시오. 현실적으로 Quadro가 필요합니다.

img2img

정확히 많이 사용되지는 않았으며 일종의 혼란스러운 탭입니다. Huggingface Image to Image SD Playground와 같이 주어진 스케치에 따라 이미지를 생성하는 데 사용할 수 있습니다. 이 탭에는 다음 섹션의 주제이자 WebUI의 매우 중요한 기능인 인페인팅(inpainting) 하위 탭이 있습니다. 이 섹션을 사용하여 이미 만든 이미지( stable-diffusion-webuioutputsimg2img-images 로 출력)에 대해 변경된 이미지를 생성할 수 있지만 기능이 불분명합니다... 엄청난 양의 메모리를 사용하는 것 같습니다. 나는 그것을 거의 작동시킬 수 없습니다. 아래의 다음 섹션으로 이동하세요.

인페인팅

콘텐츠 제작자나 이미지 교란에 관심이 있는 사람에게는 이것이 힘이 있는 곳입니다. 출력은 stable-diffusion-webuioutputsimg2img-images 에 있습니다.

인페인팅 및 아웃페인팅 가이드
4chan 인페인팅(NSFW)
최종 인페인팅 가이드

좋아하지만 완벽하지 않은 이미지를 선택하세요. 뭔가 이상합니다. 수정 이 필요합니다.
- 또는 하나를 생성하고 Send to inpaint를 클릭합니다(모든 설정이 자동으로 채워집니다).
이제 img2img -> inpaint 하위 탭에 있습니다.
변경하려는 정확한 지점을 이미지에 (마우스로) 그립니다.
마스크 모드를 "마스킹된 인페인트"로 설정하고, 마스크된 콘텐츠를 "원본"으로, 인페인트 영역을 "마스크된 부분만"으로 설정합니다.
위의 프롬프트 영역에서 이미지의 해당 지점을 조정하는 새 프롬프트를 작성합니다. 원한다면 부정적인 프롬프트를 표시하세요
이미지 생성(이상적으로는 4개 정도의 일괄 처리 수행)
원하는 것이 무엇이든 보내기를 클릭하여 인페인트하고 완성된 이미지가 나올 때까지 반복합니다.

아웃페인팅

아웃페인팅은 다소 복잡한 의미론적 과정입니다. Outpainting을 사용하면 이미지를 촬영하고 원하는 만큼 확장하여 본질적으로 이미지의 경계를 늘릴 수 있습니다. 프로세스는 여기에 설명되어 있습니다. 한 번에 64픽셀씩만 이미지를 확장할 수 있습니다. 이를 위한 두 가지 UI 도구가 있습니다(찾을 수 있음).

알파 캔버스(확장/스크립트로 WebUI에 내장됨)
Hua(인페인팅/아웃페인팅용 웹앱)

엑스트라

이 WebUI 탭은 특히 업스케일링을 위한 것입니다. 정말 마음에 드는 이미지를 얻었다면 작업 흐름이 끝날 때 여기에서 이미지를 확대할 수 있습니다. 확대된 이미지는 stable-diffusion-webuioutputsextras-images 에 저장됩니다. txt2img 탭에서 생성하는 동안 더 강력한 업스케일러를 사용한 업스케일링과 관련된 일부 메모리 문제(예: 4x+ 이미지)는 여기서 발생하지 않습니다. 왜냐하면 새 이미지를 생성하는 것이 아니라 정적 이미지만 업스케일링하기 때문입니다.

컨트롤넷

ControlNet이 수행하는 작업을 이해하는 가장 좋은 방법은 "스테로이드에 대한 페인팅"이라고 말하는 것과 같습니다. 입력 이미지(SD 생성 여부)를 제공하면 전체를 수정할 수 있습니다. ControlNet을 사용하면 포즈도 가능합니다. 사람에 대한 참조 포즈를 제공하고 일반적인 프롬프트에 따라 해당 이미지를 생성할 수 있습니다. ControlNet을 이해하기 위한 좋은 시작이 여기에 있습니다.

WebUI에 ControlNet 확장인 sd-webui-controlnet을 설치합니다.
- 설정 탭에서 UI 다시 로드 버튼을 클릭하여 UI를 다시 로드하세요.
이제 ControlNet 버튼이 추가 네트워크(LoRA를 배치한 위치) 아래의 txt2img(및 img2img) 탭에 있는지 확인하세요.
다중 ControlNet 모델 활성화: 설정 -> ControlNet -> 다중 ControlNet 슬라이더 -> 2+
- UI를 다시 로드하면 ControlNet 영역에 여러 모델 탭이 표시됩니다.
- 여러 LoRA를 사용하는 것처럼 ControlNet(예: Canny 및 OpenPose)을 결합할 수 있습니다.
ControlNet 모델 얻기
- Canny 모델은 가장자리 감지 모델입니다. 이미지는 흑백 가장자리 이미지로 변환되며, 가장자리는 SD에 대략적인 이미지 모양을 알려줍니다.
- OpenPose 모델은 사람의 이미지를 촬영하여 이후 이미지에 사용할 수 있도록 포즈 모델로 변환합니다.
- 거기에서도 조사할 수 있는 다른 모델이 많이 있습니다.
Canny 및 OpenPose 모델을 살펴보겠습니다.
stable-diffusion-webuiextensionssd-webui-controlnetmodels 에 넣으세요.
관심 있는 이미지를 얻거나 새로운 이미지를 생성하세요. 여기서는 앞서 생성한 탱크 이미지를 사용하겠습니다.
txt2img의 설정: 샘플링 방법 "DDIM", 샘플링 단계 20, 너비/높이는 선택한 이미지와 동일
ControlNet 탭의 설정: 활성화를 선택하고, 전처리기 "Canny", 모델 "control_canny-fp16", 선택한 이미지와 동일한 캔버스 너비/높이(다른 모든 설정은 기본값)
프롬프트를 수정하고 생성을 클릭하세요. 내 탱크 이미지를 화성 이미지로 변환하려고 했습니다.
- 긍정적인 프롬프트는 다음과 같습니다: 화성의 장면, 우주, 우주, 우주, ((은하 공간 배경)), 별, 달 기지, 미래 지향적, 검은 배경, 어두운 배경, 하늘의 별, (밤 시간) 붉은 모래, ((별의 별) 배경)), 탱크, bf2042, 최고 품질, 걸작, 초고해상도, (포토리얼리스틱:1.4), 디테일 스킨, 시네마틱 조명, 시네마틱 매우 디테일함, 다채롭고 현대적인 사진, 전장의 군인 그룹, 전장 곳곳에서 폭발, 하늘을 나는 제트 전투기와 헬리콥터, 지상에 탱크 2개, 사막 지역에 불타고 있는 건물, 배경, 나무, 숲, 하늘에 버려진 군용 장갑차 1대
사람들이 포함된 이미지를 찍으면 Control Model - 0의 Canny 모델과 Control Model - 1의 OpenPose 모델을 모두 수행하여 정말 재미있게 사용할 수 있습니다.
Canny와 OpenPose에 대해 자세히 알아보려면 이 비디오를 다시 시청하세요.

새로운 것을 만들기

이것은 모두 훌륭하지만 때로는 전문적인 사용 사례를 위해 더 나은 모델이나 LoRA가 필요할 수도 있습니다. 대부분의 SD 콘텐츠는 말 그대로 여성이나 포르노를 생성하기 위한 것이므로 특정 모델과 LoRA를 교육해야 할 수도 있습니다.

여기에서 관심 있는 모든 주제를 찾아보세요.
- LoRA 훈련
- LoRA 열차
- 게으른 LoRA 훈련 가이드
- CivitAI의 좋은 LoRA 교육 가이드
- 또 다른 LoRA 훈련 가이드
- 더 일반적인 LoRA 정보
- 모델 병합
- 혼합 모델

새로운 모델 훈련

DreamBooth 섹션을 참조하세요.

체크포인트 합병

TODO

WebUI의 체크포인트 병합 탭을 사용하면 마치 냄비에 두 소스를 섞는 것처럼 두 모델을 결합할 수 있습니다. 여기서 두 소스를 결합한 새로운 소스가 출력됩니다.

LoRA 훈련

TODO

LoRA를 훈련시키는 것은 반드시 어려운 것은 아니며, 단지 충분한 데이터를 수집하는 것의 문제일 뿐입니다.

구글 Colab 설정

장비에서 멀리 떨어져 작업해야 하는 경우 이는 중요한 단계입니다. Google Colab Pro는 한 달에 10달러이며 89GB의 RAM과 우수한 GPU에 대한 액세스를 제공하므로 기술적으로 휴대폰에서 메시지를 실행하고 팀북투의 서버에서 작동하도록 할 수 있습니다. 약간의 추가 비용이 부담되지 않는다면 Google Colab Pro+는 한 달에 50달러이며 훨씬 더 좋습니다.

사전 구축된 SD Colab으로 이동하세요.
GDrive에 복제하거나 그대로 사용할 수 있으므로 Github에서 항상 최신 상태를 유지할 수 있습니다.
처음 4개의 코드 블록 실행(약간의 시간 소요)
ControlNet 코드 블록 건너뛰기
'Start Stable-Diffusion' 실행(약간의 시간 소요)
- 원하는 경우 사용자 이름/비밀번호를 입력하세요. (Gradio가 공개되어 있으므로 좋은 생각일 것입니다.)
Gradio 링크('공개 URL에서 실행')를 클릭하세요.
WebUI를 평소처럼 사용하세요
- 휴대폰으로 링크를 보내면 이동 중에도 이미지를 생성할 수 있습니다.
새 모델과 LoRA를 추가하려면 Google 드라이브에 새 폴더( gdrive/MyDrive/sd/stable-diffusion-webui 가 있어야 하며 이 기본 폴더에서 로컬에서 수행했던 것과 동일한 폴더 구조를 사용할 수 있습니다. 웹UI
- 이전처럼 LoRA 확장 프로그램을 설치하면 폴더 구조가 데스크탑에서처럼 자동으로 채워집니다.
이제 사용하고 싶을 때마다 'Start Stable-Diffusion' 코드 블록을 실행하고(다른 항목은 없음) 그라디오 링크를 얻으면 작업이 완료됩니다.

Google Colab은 항상 무료이며 영원히 사용할 수 있지만 약간 느릴 수 있습니다. 월 10달러에 Colab Pro로 업그레이드하면 더 많은 기능을 사용할 수 있습니다. 하지만 월 50달러의 Colab Pro+에는 정말 재미가 있습니다. Pro+를 사용하면 탭을 닫은 후에도 24시간 동안 코드를 실행할 수 있습니다.

할 일 런타임 -> 런타임 유형 노트북 설정을 프리미엄 GPU 클래스 및 높은 RAM으로 설정할 때 Pro 구독이 중단되는 이상한 오류가 발생합니다. xFormers가 CUDA 지원으로 구축되지 않았기 때문입니다. 대신 TPU를 사용하거나 xFormers를 비활성화하면 이 문제를 해결할 수 있지만 지금은 인내심이 없습니다. Colab의 문제를 시도해 보세요.

중간 여정

MJ는 아티스트에게 정말 좋은 사람이에요. WebUI의 SD만큼 확장 가능하거나 강력하지는 않지만(NSFW는 불가능함) 꽤 멋진 것을 생성할 수 있습니다. MJ Discord(해당 사이트에 가입)에서 몇 가지 메시지를 무료로 사용하거나 기본 플랜으로 월 8달러를 지불한 후 개인 서버에서 사용할 수 있습니다. 모든 Discord 명령은 여기와 여기에서 찾을 수 있습니다. MJ의 프롬프트 구조는 다음과 같습니다.

/imagine <optional image prompt> <prompt> --parameters

엠제이 매개변수

이는 MJ V4용이며 대부분 MJ 5와 동일합니다. 모든 모델은 여기에 설명되어 있습니다.

--ar 1.2-2.1: 화면비, 기본값은 1:1
--chaos 0-100: 변형, 기본값은 0
--no plant: 식물을 제거합니다.
--q 0.0-2.0: 렌더링 품질 시간, 기본값은 1
--seed: 씨앗
--stop 10-100: 더 흐린 이미지를 생성하기 위해 작업을 중간에 중지합니다.
--style 4a/4b/4c: MJ 4' 스타일
--stylize 0-1000: MJ의 미학이 얼마나 자유롭게 실행되는지, 기본값은 100입니다.
--uplight: "라이트" 업스케일러를 사용합니다. 이미지의 디테일이 덜합니다.
--upbeta: 원본 이미지에 더 가까운 베타 업스케일러를 사용합니다.
--upanime: 애니메이션 이미지 업스케일러
--niji: 애니메이션 이미지의 대체 모델
--hd: 더 큰 이미지를 생성하는 이전 모델을 사용하며 추상 및 풍경에 적합합니다.
-테스트 : 특수 MJ 테스트 모델을 사용하십시오
-테스트 : 특수 MJ 사진 중심 테스트 모델을 사용하십시오
-타일 : MJ 5의 경우 반복 이미지를 생성합니다
- 기울어 진 이미지 체커
-V 1/2/3/4/5 : 사용할 MJ 버전 (5는 최고)

MJ 고급 프롬프트

스타일과 색상에 영향을 미치는 프롬프트의 시작 부분에 이미지 (또는 이미지)를 주입 할 수 있습니다. 이 문서를 참조하십시오. Discord 서버에 이미지를 업로드하고 마우스 오른쪽 버튼을 클릭하여 링크를 가져옵니다.
리믹스를 사용하면 이미지, 변경 모델, 주제 또는 매체의 변형을 만들 수 있습니다. 이 문서를 참조하십시오.
멀티 프롬프트를 통해 MJ는 둘 이상의 개별 개념을 개별적으로 고려할 수 있습니다. MJ 버전 1-4 및 Niji 전용. 예를 들어, "핫도그"는 음식의 이미지를 만들어 "핫 :: 개"는 따뜻한 송곳니의 이미지를 만들 것입니다. 프롬프트에 무게를 추가 할 수 있습니다. 예를 들어, "hot :: 2 dog"는 불에 개의 이미지를 만들 것입니다. MJ 1/2/3은 정수 무게를 받아들이고, MJ 4는 소수를 받아 들일 수 있습니다. 이 문서를 참조하십시오.
블렌딩하면 2-5 개의 이미지를 업로드하여 새 이미지로 병합 할 수 있습니다. /블렌드 명령은 여기에 설명되어 있습니다.

Dreamstudio

TODO

DreamStudio (DreamSbooth가 아님)는 Stability AI Company의 플래그십 플랫폼입니다. 그들의 사이트는 이미지를 생성 할 수있는 플랫폼 인 Dreambooth Studio입니다. 그것은 열린 기능 측면에서 Midjourney와 Webui 사이에 있습니다. Dreambooth Studio는 invoke.ai 플랫폼 위에 세워진 것 같습니다.

안정된 무리

TODO

안정적인 호드는 모든 사람에게 안정적인 확산을 자유롭게하기위한 커뮤니티 노력입니다. 본질적으로 토렌팅 또는 비트 코인 해싱과 같이 작동하며, 여기서 모든 사람이 SD 컨텐츠를 생성하기 위해 GPU 전력의 일부를 기여합니다. Horde 앱에 액세스 할 수 있습니다.

Dreambooth

TODO

Dreambooth (DreamStudio가 아님)는 안정적인 확산 모델 미세 조정 기술을 구현했습니다. 요컨대 : 자신의 사진으로 모델을 훈련시키는 데 사용할 수 있습니다. 여기에서 또는 여기에서 직접 사용할 수 있습니다. 실제로 새로운 모델을 교육하고 직렬화하기 위해 모델을 다운로드하고 Webui에서 클릭하는 것보다 더 복잡합니다. 일부 비디오는이를 수행하는 방법을 요약합니다.

Dreambooth 쉬운 튜토리얼
Dreambooth 10 분 훈련
Webui Dreambooth 확장

그리고 좋은 가이드 :

Reddit Advanced Dreambooth 조언
단순한 Dreambooth
Dreambooth 덤프 (많은 정보, 링크를 스크롤)

Dreambooth의 Google Colab :

Thelastben Dreambooth Training Colab (Google Colab 설정에 설명 된 SD Colab과 동일한 저자)

EveryDream이라는 모델 트레이너도 있습니다. Dreambooth와 EveryDream의 전체 비교는 여기에서 찾을 수 있습니다.

비디오 확산

TODO

3 월 -Shish 2023 기준으로 안정적인 확산을 사용하여 비디오를 생성 할 수 있습니다. 현재 (2023 년 4 월), 비디오가 유사한 이미지에서 프레임별로 생성되어 비디오에 일종의 "플립 북"모양을 제공함에 따라 기능은 다소 단순합니다. 사용할 수있는 webui에는 두 가지 기본 확장 기능이 있습니다.

애니메이터 - 더 쉽습니다
Deforum- 더 많은 기능

폐차장

내가 많이 모르지만 조사해야 할 것

좋은 결과를 반복해서 얻기 위해 따라갈 수있는 프로세스가 있습니다 ... 시간이 지남에 따라 개선됩니다.

TODO
여기에서 고정 수정
업 스케일링, 전체적으로 여기

chatgpt 통합?

유도

달 -E 2

Deforum https://deforum.github.io/

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2024-12-02
크기 5.25MB
출처 Github

StableDiffusionEndToEndGuide

안정적인 확산 엔드투엔드 가이드 - 초보부터 전문가까지

면책조항 및 출처

그것을 가지고 놀아 라!

목차

WebUI 기본

로컬 GPU 사용량 설정

리눅스 설정

더 깊게

격려

NovelAI 모델

로라

모델과 놀기

VAE

모두 함께 넣어

일반 SD 프로세스

프롬프트 저장

txt2img 설정

이전에 생성된 이미지 재생성

오류 문제 해결

편안해지기

테스트

WebUI 고급

프롬프트 편집

Xformers

img2img

인페인팅

아웃페인팅

엑스트라

컨트롤넷

새로운 것을 만들기

새로운 모델 훈련

체크포인트 합병

LoRA 훈련

구글 Colab 설정

중간 여정

엠제이 매개변수

MJ 고급 프롬프트

Dreamstudio

안정된 무리

Dreambooth

비디오 확산

폐차장