Download DiffSynth Studio - Download do código-fonte DiffSynth Studio

DiffSynth Studio

Outro código-fonte

v1.0.0

Baixar

Estúdio DiffSynth

Documento: https://diffsynth-studio.readthedocs.io/zh-cn/latest/index.html

Introdução

DiffSynth Studio é um mecanismo de difusão. Reestruturamos arquiteturas incluindo Text Encoder, UNet, VAE, entre outras, mantendo a compatibilidade com modelos da comunidade open source e melhorando o desempenho computacional. Fornecemos muitos recursos interessantes. Aproveite a magia dos modelos Diffusion!

Até agora, o DiffSynth Studio suportava os seguintes modelos:

CogVideoX
FLUXO
ExVídeo
Cores
Difusão Estável 3
Difusão de vídeo estável
Hunyuan-DiT
RIFE
ESRGAN
Adaptador IP
AnimarDiff
ControlNet
Difusão Estável XL
Difusão Estável

Notícias

25 de outubro de 2024 Oferecemos amplo suporte FLUX ControlNet. Este projeto suporta muitos modelos ControlNet diferentes que podem ser combinados livremente, mesmo que suas estruturas sejam diferentes. Além disso, os modelos ControlNet são compatíveis com refinamento de alta resolução e técnicas de controle de partição, permitindo geração de imagens controláveis muito poderosas. Consulte ./examples/ControlNet/ .
8 de outubro de 2024. Lançamos o LoRA estendido baseado em CogVideoX-5B e ExVideo. Você pode baixar este modelo em ModelScope ou HuggingFace.
22 de agosto de 2024. CogVideoX-5B é compatível com este projeto. Veja aqui. Fornecemos vários recursos interessantes para este modelo de texto para vídeo, incluindo
- Texto para vídeo
- Edição de vídeo
- Auto-upscaling
- Interpolação de vídeo
22 de agosto de 2024. Implementamos um pintor interessante que suporta todos os modelos de texto para imagem. Agora você pode criar imagens impressionantes usando o pintor, com a ajuda da IA!
- Use-o em nossa WebUI.
21 de agosto de 2024. FLUX é compatível com DiffSynth-Studio.
- Ative CFG e correção de alta resolução para melhorar a qualidade visual. Veja aqui
- LoRA, ControlNet e modelos adicionais estarão disponíveis em breve.
21 de junho de 2024. ??? Propomos o ExVideo, uma técnica de pós-ajuste que visa aprimorar a capacidade de modelos de geração de vídeo. Estendemos o Stable Video Diffusion para alcançar a geração de vídeos longos de até 128 quadros.
- Página do projeto
- O código-fonte é lançado neste repositório. Veja examples/ExVideo .
- Os modelos são lançados no HuggingFace e ModelScope.
- O relatório técnico é divulgado no arXiv.
- Você pode experimentar o ExVideo nesta demonstração!
13 de junho de 2024. DiffSynth Studio é transferido para ModelScope. Os desenvolvedores fizeram a transição de “eu” para “nós”. Claro, ainda participarei do desenvolvimento e da manutenção.
29 de janeiro de 2024. Propomos Diffutoon, uma solução fantástica para sombreamento de desenhos animados.
- Página do projeto
- Os códigos-fonte são lançados neste projeto.
- O relatório técnico (IJCAI 2024) é divulgado no arXiv.
8 de dezembro de 2023. Decidimos desenvolver um novo projeto, visando liberar o potencial dos modelos de difusão, principalmente em vídeo síntese. O desenvolvimento deste projeto está iniciado.
15 de novembro de 2023. Propomos FastBlend, um poderoso algoritmo de eliminação de cintilação de vídeo.
- A extensão sd-webui foi lançada no GitHub.
- Vídeos de demonstração são exibidos no Bilibili, incluindo três tarefas.
  - Cintilação de vídeo
  - Interpolação de vídeo
  - Renderização de vídeo baseada em imagem
- O relatório técnico é divulgado no arXiv.
- Uma extensão não oficial do ComfyUI desenvolvida por outros usuários é lançada no GitHub.
1º de outubro de 2023. Lançamos uma versão inicial deste projeto, nomeadamente FastSDXL. Uma tentativa de construir um mecanismo de difusão.
- Os códigos-fonte são lançados no GitHub.
- FastSDXL inclui um agendador OLSS treinável para melhoria de eficiência.
  - O repositório original do OLSS está aqui.
  - O relatório técnico (CIKM 2023) é divulgado no arXiv.
  - Um vídeo de demonstração é mostrado no Bilibili.
  - Como o OLSS requer treinamento adicional, não o implementamos neste projeto.
29 de agosto de 2023. Propomos DiffSynth, uma estrutura de síntese de vídeo.
- Página do projeto.
- Os códigos-fonte são liberados em EasyNLP.
- O relatório técnico (ECML PKDD 2024) foi divulgado no arXiv.

Instalação

Instalar a partir do código-fonte (recomendado):

 git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

Ou instale a partir do pypi:

 pip install diffsynth

Uso (em código Python)

Os exemplos de Python estão em examples . Fornecemos uma visão geral aqui.

Baixar modelos

Baixe os modelos predefinidos. Os IDs dos modelos podem ser encontrados no arquivo de configuração.

 from diffsynth import download_models

download_models ([ "FLUX.1-dev" , "Kolors" ])

Baixe seus próprios modelos.

 from diffsynth . models . downloader import download_from_huggingface , download_from_modelscope

# From Modelscope (recommended)
download_from_modelscope ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.bin" , "models/kolors/Kolors/vae" )
# From Huggingface
download_from_huggingface ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.safetensors" , "models/kolors/Kolors/vae" )

Síntese de Vídeo

Texto para vídeo usando CogVideoX-5B

CogVideoX-5B é lançado pela ZhiPu. Fornecemos um pipeline aprimorado, com suporte para conversão de texto em vídeo, edição de vídeo, auto-upscaling e interpolação de vídeo. examples/video_synthesis

O vídeo à esquerda é gerado usando o pipeline original de texto para vídeo, enquanto o vídeo à direita é o resultado após edição e interpolação de quadros.

cogvideo.mp4

Síntese de Vídeo Longo

Treinamos modelos de síntese de vídeo estendidos, que podem gerar 128 quadros. examples/ExVideo

github_title.mp4

demonstração.mp4

Sombreamento de desenho animado

Renderize vídeos realistas em um estilo nivelado e habilite recursos de edição de vídeo. examples/Diffutoon

Diffutoon.mp4

Diffutoon_edit.mp4

Estilização de vídeo

Estilização de vídeo sem modelos de vídeo. examples/diffsynth

pedra_do_inverno.mp4

Síntese de Imagens

Gere imagens de alta resolução, quebrando as limitações dos modelos de difusão! examples/image_synthesis .

O ajuste fino do LoRA é suportado em examples/train .

FLUXO	Difusão Estável 3

Cores	Hunyuan-DiT

Difusão Estável	Difusão Estável XL

Uso (em WebUI)

Crie imagens impressionantes usando o pintor, com a ajuda da IA!

vídeo.mp4

Este vídeo não é renderizado em tempo real.

Antes de iniciar o WebUI, baixe os modelos para a pasta ./models . Veja aqui.

Versão Gradio

 pip install gradio

 python apps/gradio/DiffSynth_Studio.py

20240822102002

Versão Streamlit

 pip install streamlit streamlit-drawable-canvas

 python -m streamlit run apps/streamlit/DiffSynth_Studio.py

sdxl_turbo_ui.mp4

Expandir

Informações adicionais

Versão v1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2024-11-08
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

PwR Studio

2024-11-14
langgraph studio

2024-11-09
sam2 studio

2024-11-08
gb studio

2024-11-06
codefusion studio

2024-11-04
vpin studio

2024-11-04

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
Sunamu

Outro código-fonte

Release 2.2.0
SmartTube

Outro código-fonte

24.71 Stable
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
slugify

Outras categorias

Version 4.6.0 (10 September 2024)

Informações Relacionadas Todos