迪斯科扩散
Frankensteinian的笔记本,模型和技术的融合,用于生成AI艺术和动画。
[要尽快更新更多信息]
贡献
该项目使用一种特殊的转换工具将Python文件转换为笔记本,以更轻松地开发。
这意味着您不必直接触摸笔记本即可进行更改
所使用的工具称为Colab-Convert
- install using
pip install colab-convert
- 转换为.ipynb
colab-convert /path/to/file.py /path/to/file.ipynb
- 转换为.ipynb为.py
colab-convert /path/to/file.ipynb /path/to/file.py
ChangElog
v1 Oct 29th 2021 - Somnai
- 添加了最初的QOL改进,包括用户友好的UI,设置+及时保存和改进的Google Drive文件夹组织。
V1.1 2021年11月13日-Somnai
- 现在包括尺寸选项,中间保存和固定图像提示以及Perlin Inits。违反批处理选项,因为它不起作用
V2更新:2021年11月22日-Somnai
- 凯瑟琳·克罗森(Katherine Crowson)辅助模型方法的初步添加(https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi #scrollto = scrollto = x5godnameucr)
- 修复错误命名的设置文件
V3更新:2021年12月24日-Somnai
- 实施了Dango的高级切口方法
- 添加了滑动型号,这要归功于神经发病
- 修复了NAN的问题,导致黑色图像,并在@softology的大量帮助和测试
- Perlin现在在批处理内正确更改(不确定此Perlin_regen代码最初来自何处,但谢谢)
V4更新:2022年1月-Somnai
- 实施扩散缩放
- 添加了Chigozie KeyFraming
- 对流程进行了一堆编辑
v4.1更新:2022年1月14日-Somnai
- 添加了视频输入模式
- 添加了以某种方式丢失的许可证
- 添加了改进的提示framing,固定的image_prompts和多个提示
- 改进的UI
- 在引擎盖清理和改进下有意义
- 每个模式的精制默认值
- Removed SLIP models for the time being due to import conflicts
- Added latent-diffusion SuperRes for sharpening
- Added resume run mode
v5 Update: Feb 20th 2022 - gandamu / Adam Letts
- 添加了3D动画模式。使用ADABIN和MIDAS深度估计模型的加权组合。使用pytorch3d在Colab和/或Linux上进行3D变换。
v5.1更新:2022年3月30日 - Zippy / Chris Allen和Gandamu / Adam Letts
- 迪斯科扩散涡轮增压的集成涡轮+光滑特征 - 仅实现,而无需默认。
- 实施了涡轮动画的简历,以至于现在可以从不同的批处理文件夹和批处理编号中恢复。
- 3D旋转参数单元现在是学位(而不是弧度)
- 更正的名称collision_mode(现在是PLMS/ddim的diffusion_sampling_mode,以及3D变换采样的Sampling_mode)
- 添加了video_init_seed_continitinuity选项,以使初始化视频动画更连续
- 将Pytorch3d删除了,需要使用专门为迪斯科扩散制作的Lite版本编译
- 删除超级分辨率
- 删除滑移型号
- 更新交叉图支持
v5.1更新:2022年4月4日-MSFTServer aka hostserver
- 将Pytorch3d删除了,需要使用专门为迪斯科扩散制作的Lite版本编译
- 删除超级分辨率
- 删除滑移型号
- 更新交叉图支持
v5.2更新:2022年4月10日-NIN_ARTVORDAR / TOM MASON
v5.3更新:2022年6月10日-Nshepperd,Huemin,cut_pow
- Horizontal and Vertical symmetry
- 添加VIT-L/14@336PX型号(需要高VRAM)
v5.4更新:2022年6月14日-Devdef / Alex Spirin,由Gandamu / Adam Letts集成到DD Main中
- 经线模式 - 用于平滑/连续的视频输入结果,利用光流估计和框架混合
- 自定义模型支持
v5.5更新:2022年7月11日-Palmweaver / Chris Scalf,Kaliyuga_ai,Gandamu / Adam Letts的进一步整合
- OpenCLIP模型集成
- 像素艺术扩散,水彩扩散和果肉Scifi扩散模型
- CUT_IC_POW调度
v5.6 Update: Jul 13th 2022 - Felipe3DArtist, integration by gandamu / Adam Letts
- 集成的Portrait_generator_v001-512x512扩散模型在脸上训练 - 来自Felipe3Dartist
v5.7更新:2022年12月31日-Steffen Moelter(与Gandamu的次要Colab -Convert集成)
- 克隆Midas V3。这修复了3D模式。自从MIDAS v3.1引入不兼容以来,它已被打破。
Notebook Provenance
凯瑟琳·克罗森(Katherine Crowson)的原始笔记本(https://github.com/crowsonkb,https://twitter.com/rivershavewings)。它使用OpenAI的256x256无条件成像网或Katherine Crowson的微调512x512扩散模型(https://github.com/openai/guided-diffusion)以及剪辑(https://github.com/openai/clip)一起带有图像的文本提示。
由丹尼尔·罗素(Daniel Russell)(https://github.com/russelldc,https://twitter.com/danielrussrussruss)修改,包括(希望)15-100个时间段的快速访问(希望)最佳参数,而不是1000,以及更多强大的增强。
Dango233和Nshepperd的进一步改进有助于提高扩散的质量,尤其是对于像This Notebook旨在实现的较短跑步的质量。
Vark一次添加了代码,以一次加载多个剪辑模型,所有提示都会对其进行评估,这可能会大大提高准确性。
最新的Zoom,Pan,Rot和KeyFrames功能取自Chigozie NRI的Vqgan Zoom Notebook(https://github.com/chigozienri,https://twitter.com/chigozienri)
先进的dangocutn切割方法也来自Dango223。
- -
Somnai(https://twitter.com/somnai_dreams)添加了2D扩散动画技术,QOL改进和技术和技术的各种实现,主要在下面的ChangElog中列出。
由Adam Letts(https://twitter.com/gandamu_ml)添加的3D动画实现与Somnai合作。
Chris Allen的Turbo功能(https://twitter.com/zippy731)
提高在本地系统,Windows支持和依赖性安装的能力(https://twitter.com/hostsserver)
汤姆·梅森(Tom Mason)的VR模式(https://twitter.com/nin_artavering)
Nshepperd的水平和垂直对称功能。 huemin(https://twitter.com/huemin_art)的对称转换_steps。由dmitrii tochilkin(https://twitter.com/cut_pow)中的对称性集成到迪斯科扩散中。
Alex Spirin(https://twitter.com/devdef)的经线和自定义模型支持。
从kaliyuga(https://twitter.com/kaliyuga_ai)发出的像素艺术扩散,水彩扩散和果肉Scifi扩散模型。请按照Kaliyuga的Twitter进行最新型号和具有专业设置的笔记本。
OpenClip模型的集成以及棕榈树/Chris Scalf的Kaliyuga模型集成(https://twitter.com/chrisscalf11)
felipe3dartist(https://twitter.com/felipe3dartist)的集成portrait_generator_v001
MIDAS版本标签修复了Steffen Moelter(引入了MIDAS v3.1之后的3D动画模式的必要修复程序)。