디스코 확산
AI 아트 및 애니메이션의 생성을위한 노트북, 모델 및 기술의 프랑켄슈타인 합병.
[곧 추가 정보로 업데이트 될]
기여
이 프로젝트는 특수 변환 도구를 사용하여 Python 파일을 노트북으로 변환하여 개발을보다 쉽게 개발합니다.
이것이 의미하는 바는 당신이 그것을 변경하기 위해 노트북을 직접 만질 필요가 없다는 것입니다.
사용중인 도구를 Colab-Convert라고합니다
-
pip install colab-convert
사용하여 설치하십시오 - .py를 .ipynb
colab-convert /path/to/file.py /path/to/file.ipynb
로 변환하십시오 - .ipynb를 .py
colab-convert /path/to/file.ipynb /path/to/file.py
로 변환하십시오
changelog
v1 10 월 29 일 2021 -Somnai
- 사용자 친화적 UI, 설정+프롬프트 저장 및 개선 된 Google 드라이브 폴더 조직을 포함한 초기 QOL 개선이 추가되었습니다.
v1.1 2021 년 11 월 13 일 -Somnai
- 이제 크기 조정 옵션, 중간 저장 및 고정 이미지 프롬프트 및 Perlin INIT가 포함되어 있습니다. 노출되지 않은 배치 옵션이 작동하지 않으므로
v2 업데이트 : 2021 년 11 월 22 일 -Somnai
- Katherine Crowson의 2 차 모델 방법의 초기 추가 (https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi#scrollto=x5godnameucr)
- 잘못 지정된 설정 파일에 대해 수정하십시오
V3 업데이트 : 2021 년 12 월 24 일 -Somnai
- Dango의 고급 컷 아웃 방법을 구현했습니다
- NeuralDivergent 덕분에 슬립 모델이 추가되었습니다
- @softology의 대규모 도움말과 테스트와 함께 검은 이미지를 초래하는 NAN의 고정 문제
- Perlin은 이제 배치 내에서 제대로 변경됩니다 (이 Perlin_regen 코드는 원래 어디에서 왔는지 확실하지 않지만 감사합니다)
V4 업데이트 : 2022 년 1 월 -Somnai
- 확산 줌 구현
- Chigozie KeyFraming을 추가했습니다
- 프로세스에 많은 편집을했습니다
v4.1 업데이트 : 2022 년 1 월 14 일 -Somnai
- 비디오 입력 모드가 추가되었습니다
- 어떻게 든 누락 된 라이센스가 추가되었습니다
- 향상된 프롬프트 키 프레임, 고정 Image_Prompts 및 여러 프롬프트가 추가되었습니다
- UI 향상
- 후드 정리 및 개선에서 중요합니다
- 각 모드에 대한 세련된 기본값
- 수입 충돌로 인한 당분간 슬립 모델 제거
- 샤프닝을 위해 잠재 확산 슈퍼 레스가 추가되었습니다
- 이력서 실행 모드가 추가되었습니다
V5 업데이트 : 2022 년 2 월 20 일 -Gandamu / Adam Letts
- 3D 애니메이션 모드가 추가되었습니다. Adabins와 Midas 깊이 추정 모델의 가중 조합을 사용합니다. Colab 및/또는 Linux에서 3D 변환에 pytorch3d를 사용합니다.
v5.1 업데이트 : 2022 년 3 월 30 일 -Zippy / Chris Allen 및 Gandamu / Adam Letts
- Disco Diffusion Turbo의 통합 Turbo+부드러운 기능 - 기본값이없는 구현.
- 다른 배치 폴더와 배치 번호에서 재개 할 수있는 방식으로 터보 애니메이션 이력서를 구현했습니다.
- 3D 회전 매개 변수 단위는 이제 라디안이 아닌 각도입니다.
- Sampling_Mode에서 수정 된 이름 충돌 (이제 PLMS/DDIM 용 Diffusion_Sampling_Mode 및 3D 변환 샘플링 용 Sampling_Mode)
- video_init_seed_continuity 추가 init init video 애니메이션을보다 연속적으로 만들기
- 디스코 확산을 위해 특별히 제작 된 라이트 버전으로 컴파일 해야하는 pytorch3d 제거
- 슈퍼 해상도를 제거하십시오
- 슬립 모델을 제거하십시오
- CrossPlatform 지원을위한 업데이트
v5.1 업데이트 : 2022 년 4 월 4 일 -MSFTSERVER AKA 호스트 서버
- 디스코 확산을 위해 특별히 제작 된 라이트 버전으로 컴파일 해야하는 pytorch3d 제거
- 슈퍼 해상도를 제거하십시오
- 슬립 모델을 제거하십시오
- CrossPlatform 지원을위한 업데이트
v5.2 업데이트 : 4 월 10 일 2022 년 -Nin_artificial / Tom Mason
v5.3 업데이트 : 2022 년 6 월 10 일 -Nshepperd, Huemin, Cut_pow
- 수평 및 수직 대칭
- VIT-L/14@336PX 모델 추가 (높은 VRAM 필요)
v5.4 업데이트 : 2022 년 6 월 14 일 -Gandamu / Adam Letts에 의해 DD Main에 통합 된 Devdef / Alex Spirin
- 워프 모드 - 광학 흐름 추정 및 프레임 블렌딩을 활용하는 부드러운/연속 비디오 입력 결과
- 맞춤형 모델 지원
v5.5 업데이트 : 2022 년 7 월 11 일 -Palmweaver / Chris Scalf, Kaliyuga_ai, Gandamu / Adam Letts의 추가 통합
- OpenClip 모델 통합
- 픽셀 ART 확산, 수채화 확산 및 펄프 공상 확산 모델
- cut_ic_pow 스케줄링
v5.6 업데이트 : 2022 년 7 월 13 일 -Felipe3dartist, Gandamu / Adam Letts의 통합
- 통합 aptorait_generator_v001-512x512 얼굴 훈련 - Felipe3dartist에서 훈련 된 확산 모델
v5.7 업데이트 : 2022 년 12 월 31 일 -Steffen Moelter (Gandamu의 작은 Colab -Convert Integration)
- 클론 MIDAS V3. 이것은 3D 모드를 수정합니다. Midas v3.1이 비 호환성을 도입 한 이후로 깨졌습니다.
노트북 출처
Katherine Crowson의 오리지널 노트북 (https://github.com/crowsonkb, https://twitter.com/rivershavewings). Openai의 256x256 무조건 Imagenet 또는 Katherine Crowson의 미세 조정 된 512x512 확산 모델 (https://github.com/openai/guided-diffusion)을 사용하여 클립 (https://github.com/openai/clip)을 사용합니다. 텍스트는 이미지와 함께 프롬프트합니다.
Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss)에 의해 수정되어 1000이 아닌 15-100 타임 스펙트에 빠른 세대에 대한 최적의 매개 변수와 더 강한 증강 .
Dango233 및 NSHEPPERD의 추가 개선은 일반적으로 확산의 품질을 향상시키는 데 도움이되었으며, 특히이 노트북과 같은 짧은 달리기의 경우 달성을 목표로합니다.
Vark는 여러 클립 모델에 한 번에로드 할 코드를 추가했으며 모든 프롬프트가 평가되어 정확도를 크게 향상시킬 수 있습니다.
최신 줌, 팬, 회전 및 키 프레임 기능은 Chigozie NRI의 VQGAN Zoom Notebook (https://github.com/chigozienri, https://twitter.com/chigozienri)에서 가져 왔습니다.
Advanced Dangocutn 컷 아웃 방법은 Dango223에서도 제공됩니다.
-
Somnai (https://twitter.com/somnai_dreams)는 2D 확산 애니메이션 기술, QOL 개선 및 다양한 기술 및 기술 구현을 추가했습니다.
Somnai와 공동으로 Adam Letts (https://twitter.com/gandamu_ml)가 추가 한 3D 애니메이션 구현.
Chris Allen의 터보 기능 (https://twitter.com/zippy731)
HostsServer (https://twitter.com/hostsserver)의 로컬 시스템, Windows 지원 및 종속성 설치 능력 향상
Tom Mason의 VR 모드 (https://twitter.com/nin_artificial)
nshepperd의 수평 및 수직 대칭 기능. Huemin의 대칭 변환 _steps (https://twitter.com/huemin_art). dmitrii tochilkin (https://twitter.com/cut_pow)에 의한 디스코 확산으로의 대칭 통합.
Alex Spirin (https://twitter.com/devdef)의 워프 및 사용자 정의 모델 지원.
Kaliyuga (https://twitter.com/kaliyuga_ai)의 픽셀 ART 확산, 수채 확산 및 펄프 공상 확산 모델. Kaliyuga의 Twitter를 팔로우하여 최신 모델과 특수 설정이있는 노트북을 위해.
OpenClip 모델의 통합 및 Palmweaver/Chris Scalf (https://twitter.com/chrisscalf11)의 Kaliyuga 모델 통합 개시
felipe3dartist의 통합 aptorait_generator_v001 (https://twitter.com/felipe3dartist)
Steffen Moelter의 Midas 버전 태그 수정 (Midas v3.1이 소개 된 후 3D 애니메이션 모드에 필요한 수정).