disco diffusion下載 - disco diffusion源代碼下載

disco diffusion

其他源碼

v5.4.0

下載

迪斯科擴散

Frankensteinian的筆記本，模型和技術的融合，用於生成AI藝術和動畫。

[要盡快更新更多信息]

貢獻

該項目使用一種特殊的轉換工具將Python文件轉換為筆記本，以更輕鬆地開發。

這意味著您不必直接觸摸筆記本即可進行更改

所使用的工具稱為Colab-Convert

使用pip install colab-convert
轉換為.ipynb colab-convert /path/to/file.py /path/to/file.ipynb
轉換為.ipynb為.py colab-convert /path/to/file.ipynb /path/to/file.py

ChangElog

V1 2021年10月29日-Somnai

添加了最初的QOL改進，包括用戶友好的UI，設置+及時保存和改進的Google Drive文件夾組織。

V1.1 2021年11月13日-Somnai

現在包括尺寸選項，中間保存和固定圖像提示以及Perlin Inits。違反批處理選項，因為它不起作用

V2更新：2021年11月22日-Somnai

凱瑟琳·克羅森（Katherine Crowson）輔助模型方法的初步添加（https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi #scrollto = scrollto = x5godnameucr）
修復錯誤命名的設置文件

V3更新：2021年12月24日-Somnai

實施了Dango的高級切口方法
添加了滑動型號，這要歸功於神經發病
修復了NAN的問題，導致黑色圖像，並在@softology的大量幫助和測試
Perlin現在在批處理內正確更改（不確定此Perlin_regen代碼最初來自何處，但謝謝）

V4更新：2022年1月-Somnai

實施擴散縮放
添加了Chigozie KeyFraming
對流程進行了一堆編輯

v4.1更新：2022年1月14日-Somnai

添加了視頻輸入模式
添加了以某種方式丟失的許可證
添加了改進的提示framing，固定的image_prompts和多個提示
改進的UI
在引擎蓋清理和改進下有意義
每個模式的精製默認值
暫時刪除了滑移模型，這是由於進口衝突
添加了用於銳化的潛在擴散超級
添加了簡歷運行模式

V5更新：2022年2月20日-Gandamu / Adam Letts

添加了3D動畫模式。使用ADABIN和MIDAS深度估計模型的加權組合。使用pytorch3d在Colab和/或Linux上進行3D變換。

v5.1更新：2022年3月30日 - Zippy / Chris Allen和Gandamu / Adam Letts

迪斯科擴散渦輪增壓的集成渦輪+光滑特徵 - 僅實現，而無需默認。
實施了渦輪動畫的簡歷，以至於現在可以從不同的批處理文件夾和批處理編號中恢復。
3D旋轉參數單元現在是學位（而不是弧度）
更正的名稱collision_mode（現在是PLMS/ddim的diffusion_sampling_mode，以及3D變換採樣的Sampling_mode）
添加了video_init_seed_continitinuity選項，以使初始化視頻動畫更連續
將Pytorch3d刪除了，需要使用專門為迪斯科擴散製作的Lite版本編譯
刪除超級分辨率
刪除滑移型號
更新交叉圖支持

v5.1更新：2022年4月4日-MSFTServer aka hostserver

將Pytorch3d刪除了，需要使用專門為迪斯科擴散製作的Lite版本編譯
刪除超級分辨率
刪除滑移型號
更新交叉圖支持

v5.2更新：2022年4月10日-NIN_ARTVORDAR / TOM MASON

VR模式

v5.3更新：2022年6月10日-Nshepperd，Huemin，cut_pow

水平和垂直對稱性
添加VIT-L/14@336PX型號（需要高VRAM）

v5.4更新：2022年6月14日-Devdef / Alex Spirin，由Gandamu / Adam Letts集成到DD Main中

經線模式 - 用於平滑/連續的視頻輸入結果，利用光流估計和框架混合
自定義模型支持

v5.5更新：2022年7月11日-Palmweaver / Chris Scalf，Kaliyuga_ai，Gandamu / Adam Letts的進一步整合

OpenCLIP模型集成
像素藝術擴散，水彩擴散和果肉Scifi擴散模型
CUT_IC_POW調度

v5.6更新：2022年7月13日-Felipe3Dartist，Gandamu / Adam Letts的集成

集成的Portrait_generator_v001-512x512擴散模型在臉上訓練 - 來自Felipe3Dartist

v5.7更新：2022年12月31日-Steffen Moelter（與Gandamu的次要Colab -Convert集成）

克隆Midas V3。這修復了3D模式。自從MIDAS v3.1引入不兼容以來，它已被打破。

筆記本出處

凱瑟琳·克羅森（Katherine Crowson）的原始筆記本（https://github.com/crowsonkb，https://twitter.com/rivershavewings）。它使用OpenAI的256x256無條件成像網或Katherine Crowson的微調512x512擴散模型（https://github.com/openai/guided-diffusion）以及剪輯（https://github.com/openai/clip）一起帶有圖像的文本提示。

由丹尼爾·羅素（Daniel Russell）（https://github.com/russelldc，https://twitter.com/danielrussrussruss）修改，包括（希望）15-100個時間段的快速訪問（希望）最佳參數，而不是1000，以及更多強大的增強。

Dango233和Nshepperd的進一步改進有助於提高擴散的質量，尤其是對於像This Notebook旨在實現的較短跑步的質量。

Vark一次添加了代碼，以一次加載多個剪輯模型，所有提示都會對其進行評估，這可能會大大提高準確性。

最新的Zoom，Pan，Rot和KeyFrames功能取自Chigozie NRI的Vqgan Zoom Notebook（https://github.com/chigozienri，https://twitter.com/chigozienri）

先進的dangocutn切割方法也來自Dango223。

- -

Somnai（https://twitter.com/somnai_dreams）添加了2D擴散動畫技術，QOL改進和技術和技術的各種實現，主要在下面的ChangElog中列出。

由Adam Letts（https://twitter.com/gandamu_ml）添加的3D動畫實現與Somnai合作。

Chris Allen的Turbo功能（https://twitter.com/zippy731）

提高在本地系統，Windows支持和依賴性安裝的能力（https://twitter.com/hostsserver）

湯姆·梅森（Tom Mason）的VR模式（https://twitter.com/nin_artavering）

Nshepperd的水平和垂直對稱功能。 huemin（https://twitter.com/huemin_art）的對稱轉換_steps。由dmitrii tochilkin（https://twitter.com/cut_pow）中的對稱性集成到迪斯科擴散中。