Suporte inicial para Tora (https://github.com/alibaba/Tora)
Modelo convertido (incluído no nó de download automático):
https://huggingface.co/Kijai/CogVideoX-5b-Tora/tree/main
Esta semana houve algumas atualizações maiores que provavelmente afetarão alguns fluxos de trabalho antigos, especialmente o nó do amostrador que provavelmente precisará ser atualizado (recriado) se ocorrer um erro!
Novos recursos:
Suporte inicial para a versão oficial I2V do CogVideoX: https://huggingface.co/THUDM/CogVideoX-5b-I2V
Também precisa de difusores 0.30.3
Adicionado suporte inicial para CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
Observe que embora este possa fazer image2vid, este ainda NÃO é o modelo I2V oficial, embora também deva ser lançado em breve.
Adicionado suporte experimental para onediff, reduzindo o tempo de amostragem em ~ 40% para mim, atingindo 4,23 s/it no 4090 com 49 quadros. Isso requer o uso de Linux, torch 2.4.0, instalação onediff e nexfort:
pip install --pre onediff onediffx
pip install nexfort
A primeira execução levará cerca de 5 minutos para a compilação.
O modelo 5b agora também é compatível com text2vid básico: https://huggingface.co/THUDM/CogVideoX-5b
Ele também é baixado automaticamente para ComfyUI/models/CogVideo/CogVideoX-5b
, o codificador de texto não é necessário, pois usamos o ComfyUI T5.
Requer difusores 0.30.1 (isso é especificado em requisitos.txt)
Usa o mesmo modelo T5 que SD3 e Flux, fp8 também funciona bem. Os requisitos de memória dependem principalmente da duração do vídeo. A decodificação VAE parece ser a única grande que consome muito VRAM quando tudo é descarregado, atingindo picos em torno de 13-14 GB momentaneamente nesse estágio. A amostragem em si leva apenas de 5 a 6 GB.
Hackeado no img2img para tentar o fluxo de trabalho vid2vid, funciona de forma interessante com algumas entradas, altamente experimental.
Também foram adicionados blocos temporais como forma de gerar vídeos infinitos:
https://github.com/kijai/ComfyUI-CogVideoXWrapper
Repositório original: https://github.com/THUDM/CogVideo
CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
Controlnet: https://github.com/TheDenk/cogvideox-controlnet