迪斯科擴散
Frankensteinian的筆記本,模型和技術的融合,用於生成AI藝術和動畫。
[要盡快更新更多信息]
貢獻
該項目使用一種特殊的轉換工具將Python文件轉換為筆記本,以更輕鬆地開發。
這意味著您不必直接觸摸筆記本即可進行更改
所使用的工具稱為Colab-Convert
- 使用
pip install colab-convert
- 轉換為.ipynb
colab-convert /path/to/file.py /path/to/file.ipynb
- 轉換為.ipynb為.py
colab-convert /path/to/file.ipynb /path/to/file.py
ChangElog
V1 2021年10月29日-Somnai
- 添加了最初的QOL改進,包括用戶友好的UI,設置+及時保存和改進的Google Drive文件夾組織。
V1.1 2021年11月13日-Somnai
- 現在包括尺寸選項,中間保存和固定圖像提示以及Perlin Inits。違反批處理選項,因為它不起作用
V2更新:2021年11月22日-Somnai
- 凱瑟琳·克羅森(Katherine Crowson)輔助模型方法的初步添加(https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi #scrollto = scrollto = x5godnameucr)
- 修復錯誤命名的設置文件
V3更新:2021年12月24日-Somnai
- 實施了Dango的高級切口方法
- 添加了滑動型號,這要歸功於神經發病
- 修復了NAN的問題,導致黑色圖像,並在@softology的大量幫助和測試
- Perlin現在在批處理內正確更改(不確定此Perlin_regen代碼最初來自何處,但謝謝)
V4更新:2022年1月-Somnai
- 實施擴散縮放
- 添加了Chigozie KeyFraming
- 對流程進行了一堆編輯
v4.1更新:2022年1月14日-Somnai
- 添加了視頻輸入模式
- 添加了以某種方式丟失的許可證
- 添加了改進的提示framing,固定的image_prompts和多個提示
- 改進的UI
- 在引擎蓋清理和改進下有意義
- 每個模式的精製默認值
- 暫時刪除了滑移模型,這是由於進口衝突
- 添加了用於銳化的潛在擴散超級
- 添加了簡歷運行模式
V5更新:2022年2月20日-Gandamu / Adam Letts
- 添加了3D動畫模式。使用ADABIN和MIDAS深度估計模型的加權組合。使用pytorch3d在Colab和/或Linux上進行3D變換。
v5.1更新:2022年3月30日 - Zippy / Chris Allen和Gandamu / Adam Letts
- 迪斯科擴散渦輪增壓的集成渦輪+光滑特徵 - 僅實現,而無需默認。
- 實施了渦輪動畫的簡歷,以至於現在可以從不同的批處理文件夾和批處理編號中恢復。
- 3D旋轉參數單元現在是學位(而不是弧度)
- 更正的名稱collision_mode(現在是PLMS/ddim的diffusion_sampling_mode,以及3D變換採樣的Sampling_mode)
- 添加了video_init_seed_continitinuity選項,以使初始化視頻動畫更連續
- 將Pytorch3d刪除了,需要使用專門為迪斯科擴散製作的Lite版本編譯
- 刪除超級分辨率
- 刪除滑移型號
- 更新交叉圖支持
v5.1更新:2022年4月4日-MSFTServer aka hostserver
- 將Pytorch3d刪除了,需要使用專門為迪斯科擴散製作的Lite版本編譯
- 刪除超級分辨率
- 刪除滑移型號
- 更新交叉圖支持
v5.2更新:2022年4月10日-NIN_ARTVORDAR / TOM MASON
v5.3更新:2022年6月10日-Nshepperd,Huemin,cut_pow
- 水平和垂直對稱性
- 添加VIT-L/14@336PX型號(需要高VRAM)
v5.4更新:2022年6月14日-Devdef / Alex Spirin,由Gandamu / Adam Letts集成到DD Main中
- 經線模式 - 用於平滑/連續的視頻輸入結果,利用光流估計和框架混合
- 自定義模型支持
v5.5更新:2022年7月11日-Palmweaver / Chris Scalf,Kaliyuga_ai,Gandamu / Adam Letts的進一步整合
- OpenCLIP模型集成
- 像素藝術擴散,水彩擴散和果肉Scifi擴散模型
- CUT_IC_POW調度
v5.6更新:2022年7月13日-Felipe3Dartist,Gandamu / Adam Letts的集成
- 集成的Portrait_generator_v001-512x512擴散模型在臉上訓練 - 來自Felipe3Dartist
v5.7更新:2022年12月31日-Steffen Moelter(與Gandamu的次要Colab -Convert集成)
- 克隆Midas V3。這修復了3D模式。自從MIDAS v3.1引入不兼容以來,它已被打破。
筆記本出處
凱瑟琳·克羅森(Katherine Crowson)的原始筆記本(https://github.com/crowsonkb,https://twitter.com/rivershavewings)。它使用OpenAI的256x256無條件成像網或Katherine Crowson的微調512x512擴散模型(https://github.com/openai/guided-diffusion)以及剪輯(https://github.com/openai/clip)一起帶有圖像的文本提示。
由丹尼爾·羅素(Daniel Russell)(https://github.com/russelldc,https://twitter.com/danielrussrussruss)修改,包括(希望)15-100個時間段的快速訪問(希望)最佳參數,而不是1000,以及更多強大的增強。
Dango233和Nshepperd的進一步改進有助於提高擴散的質量,尤其是對於像This Notebook旨在實現的較短跑步的質量。
Vark一次添加了代碼,以一次加載多個剪輯模型,所有提示都會對其進行評估,這可能會大大提高準確性。
最新的Zoom,Pan,Rot和KeyFrames功能取自Chigozie NRI的Vqgan Zoom Notebook(https://github.com/chigozienri,https://twitter.com/chigozienri)
先進的dangocutn切割方法也來自Dango223。
- -
Somnai(https://twitter.com/somnai_dreams)添加了2D擴散動畫技術,QOL改進和技術和技術的各種實現,主要在下面的ChangElog中列出。
由Adam Letts(https://twitter.com/gandamu_ml)添加的3D動畫實現與Somnai合作。
Chris Allen的Turbo功能(https://twitter.com/zippy731)
提高在本地系統,Windows支持和依賴性安裝的能力(https://twitter.com/hostsserver)
湯姆·梅森(Tom Mason)的VR模式(https://twitter.com/nin_artavering)
Nshepperd的水平和垂直對稱功能。 huemin(https://twitter.com/huemin_art)的對稱轉換_steps。由dmitrii tochilkin(https://twitter.com/cut_pow)中的對稱性集成到迪斯科擴散中。
Alex Spirin(https://twitter.com/devdef)的經線和自定義模型支持。
從kaliyuga(https://twitter.com/kaliyuga_ai)發出的像素藝術擴散,水彩擴散和果肉Scifi擴散模型。請按照Kaliyuga的Twitter進行最新型號和具有專業設置的筆記本。
OpenClip模型的集成以及棕櫚樹/Chris Scalf的Kaliyuga模型集成(https://twitter.com/chrisscalf11)
felipe3dartist(https://twitter.com/felipe3dartist)的集成portrait_generator_v001
MIDAS版本標籤修復了Steffen Moelter(引入了MIDAS v3.1之後的3D動畫模式的必要修復程序)。