DiffSynth Studioダウンロード - DiffSynth Studioソースコードのダウンロード

DiffSynth Studio

その他のソースコード

v1.0.0

ダウンロード

ディフシンセスタジオ

ドキュメント: https://diffsynth-studio.readthedocs.io/zh-cn/latest/index.html

導入

DiffSynth Studio は拡散エンジンです。私たちは、テキストエンコーダー、UNet、VAE などのアーキテクチャを再構築し、オープンソースコミュニティのモデルとの互換性を維持しながら、計算パフォーマンスを向上させました。多くの興味深い機能を提供します。ディフュージョンモデルの魅力を楽しんでください！

これまで、DiffSynth Studio は次のモデルをサポートしていました。

コグビデオX
フラックス
エクスビデオ
カラーズ
安定拡散3
安定した動画の普及
フンユアン-DiT
ライフ
エスガン
IPアダプター
アニメイトディフ
コントロールネット
安定拡散XL
安定した拡散

ニュース

2024 年 10 月 25 日当社は広範な FLUX ControlNet サポートを提供します。このプロジェクトは、構造が異なっていても自由に組み合わせることができるさまざまな ControlNet モデルをサポートしています。さらに、ControlNet モデルは高解像度リファインメントおよびパーティション制御技術と互換性があり、非常に強力で制御可能な画像生成を可能にします。 ./examples/ControlNet/を参照してください。
2024 年 10 月 8 日。CogVideoX -5B および ExVideo をベースにした拡張 LoRA をリリースします。このモデルは ModelScope または HuggingFace からダウンロードできます。
2024 年 8 月 22 日。このプロジェクトでは CogVideoX-5B がサポートされています。ここを参照してください。このテキストからビデオへのモデルには、次のようないくつかの興味深い機能が提供されています。
- テキストからビデオへ
- ビデオ編集
- 自己アップスケーリング
- ビデオ補間
2024 年 8 月 22 日。すべてのテキストから画像へのモデルをサポートする興味深いペインターを実装しました。 AI の支援を受けて、ペインターを使用して素晴らしい画像を作成できるようになりました。
- WebUI で使用します。
2024 年 8 月 21 日。FLUXが DiffSynth-Studio でサポートされました。
- CFG と高解像度修正を有効にして、視覚的な品質を向上させます。ここを参照
- LoRA、ControlNet、およびその他のモデルは間もなく利用可能になります。
2024年6月21日。我々は、ビデオ生成モデルの機能を強化することを目的としたポストチューニング手法である ExVideo を提案します。 Stable Video Diffusion を拡張し、最大 128 フレームの長いビデオの生成を実現しました。
- プロジェクトページ
- ソースコードはこのリポジトリで公開されています。 examples/ExVideo参照してください。
- モデルはHuggingFaceとModelScopeで公開されています。
- 技術レポートはarXivで公開されています。
- このデモでは ExVideo を試すことができます。
2024 年 6 月 13 日。DiffSynth Studio は ModelScope に移管されました。開発者は「私」から「私たち」に移行しました。もちろん、今後も開発やメンテナンスには参加していきます。
2024 年 1 月 29 日。トゥーンシェーディングの素晴らしいソリューションである Diffutoon を提案します。
- プロジェクトページ
- このプロジェクトではソースコードが公開されています。
- 技術レポート（IJCAI 2024）をarXivで公開しました。
2023 年 12 月 8 日。特にビデオ合成における拡散モデルの可能性を解放することを目的として、新しいプロジェクトを開発することを決定しました。このプロジェクトの開発が開始されます。
2023 年 11 月 15 日。私たちは、強力なビデオフリッカー除去アルゴリズムである FastBlend を提案します。
- sd-webui 拡張機能は GitHub でリリースされています。
- Bilibili では 3 つのタスクを含むデモビデオが公開されています。
  - ビデオのちらつき
  - ビデオ補間
  - 画像主導のビデオレンダリング
- 技術レポートはarXivで公開されています。
- 他のユーザーが開発した非公式の ComfyUI 拡張機能が GitHub でリリースされています。
2023 年 10 月 1 日。このプロジェクトの初期バージョン、つまり FastSDXL をリリースします。拡散エンジンの構築に挑戦。
- ソースコードはGitHubで公開しています。
- FastSDXL には、効率を向上させるためのトレーニング可能な OLSS スケジューラが含まれています。
  - OLSS のオリジナルのリポジトリはここにあります。
  - テクニカルレポート（CIKM 2023）がarXivで公開されています。
  - Bilibiliでデモビデオが公開されています。
  - OLSS には追加のトレーニングが必要なため、このプロジェクトでは実装しません。
2023年8月29日.ビデオ合成フレームワークである DiffSynth を提案します。
- プロジェクトページ。
- ソースコードはEasyNLPで公開されています。
- 技術レポート (ECML PKDD 2024) が arXiv で公開されています。

インストール

ソースコードからインストールします (推奨):

 git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

または、pypi からインストールします。

 pip install diffsynth

使用法 (Python コード内)

Python の例はexamplesにあります。ここでは概要を説明します。

モデルをダウンロードする

プリセットモデルをダウンロードします。モデル ID は構成ファイルで確認できます。

 from diffsynth import download_models

download_models ([ "FLUX.1-dev" , "Kolors" ])

独自のモデルをダウンロードします。

 from diffsynth . models . downloader import download_from_huggingface , download_from_modelscope

# From Modelscope (recommended)
download_from_modelscope ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.bin" , "models/kolors/Kolors/vae" )
# From Huggingface
download_from_huggingface ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.safetensors" , "models/kolors/Kolors/vae" )

ビデオ合成

CogVideoX-5B を使用したテキストからビデオへの変換

CogVideoX-5B は ZhiPu からリリースされています。改良されたパイプラインを提供し、テキストからビデオへの変換、ビデオ編集、自己アップスケーリング、およびビデオ補間をサポートします。 examples/video_synthesis

左側のビデオは元のテキストからビデオへのパイプラインを使用して生成され、右側のビデオは編集とフレーム補間の後の結果です。

コグビデオ.mp4

長時間のビデオ合成

128 フレームを生成できる拡張ビデオ合成モデルをトレーニングしました。 examples/ExVideo

github_title.mp4

デモ.mp4

トゥーンシェーディング

フラット化スタイルでリアルなビデオをレンダリングし、ビデオ編集機能を有効にします。 examples/Diffutoon

ディフトゥーン.mp4

ディフトゥーン_編集.mp4

ビデオのスタイル化

ビデオモデルを使用しないビデオのスタイル化。 examples/diffsynth

冬の石.mp4

画像合成

拡散モデルの限界を打ち破り、高解像度の画像を生成！ examples/image_synthesis 。

LoRA の微調整は、 examples/trainでサポートされています。

フラックス	安定拡散3

カラーズ	フンユアン-DiT

安定した拡散	安定拡散XL

使用法 (WebUI で)

AI の支援を受けながら、ペインターを使用して素晴らしい画像を作成しましょう。

ビデオ.mp4

このビデオはリアルタイムではレンダリングされません。

WebUI を起動する前に、モデルを./modelsフォルダーにダウンロードしてください。ここを参照してください。

Gradioバージョン

 pip install gradio

 python apps/gradio/DiffSynth_Studio.py

20240822102002

Streamlitバージョン

 pip install streamlit streamlit-drawable-canvas

 python -m streamlit run apps/streamlit/DiffSynth_Studio.py

sdxl_turbo_ui.mp4

拡大する

追加情報

バージョン v1.0.0
タイプその他のソースコード
更新時間 2024-11-08
サイズ 50MB
から Github

DiffSynth Studio

ディフシンセスタジオ

導入

ニュース

インストール

使用法 (Python コード内)

モデルをダウンロードする

ビデオ合成

CogVideoX-5B を使用したテキストからビデオへの変換

長時間のビデオ合成

トゥーンシェーディング

ビデオのスタイル化

画像合成

使用法 (WebUI で)

PwR Studio

langgraph studio

sam2 studio

gb studio

codefusion studio

vpin studio

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

chat.petals.dev

waymo open dataset

termwind

wp functions

DiffSynth Studio

ディフシンセ スタジオ

導入

ニュース

インストール

使用法 (Python コード内)

モデルをダウンロードする

ビデオ合成

CogVideoX-5B を使用したテキストからビデオへの変換

長時間のビデオ合成

トゥーンシェーディング

ビデオのスタイル化

画像合成

使用法 (WebUI で)

ディフシンセスタジオ