Difusión de disco
Una amalgamación frankensteiniana de cuadernos, modelos y técnicas para la generación de arte y animaciones de IA.
[Para ser actualizado con más información pronto]
Que contribuye
Este proyecto utiliza una herramienta de conversión especial para convertir los archivos de Python en cuadernos para un desarrollo más fácil.
Lo que esto significa es que no tiene que tocar el cuaderno directamente para hacer cambios en él.
La herramienta que se usa se llama colab convertida
- Instalar usando
pip install colab-convert
- convertir .py a .ipynb
colab-convert /path/to/file.py /path/to/file.ipynb
- convertir .ipynb a .py
colab-convert /path/to/file.ipynb /path/to/file.py
Colegio de cambios
V1 Oct 29 de 2021 - Somnai
- Se agregaron mejoras iniciales de calidad de vida, incluida la interfaz de usuario fácil de usar, la configuración+guardar el aviso y la organización mejorada de la carpeta de Google Drive.
V1.1 13 de noviembre de 2021 - Somnai
- Ahora incluye opciones de tamaño, guardados intermedios y indicaciones de imagen fijas e INITS Perlin. opción de lote no expuesta ya que no funciona
Actualización de V2: 22 de noviembre de 2021 - Somnai
- Adición inicial del método de modelo secundario de Katherine Crowsson (https://colab.research.google.com/drive/1mpkrhojoyzpeswy2r7t8eyrau7amyooi#scrollto=x5godnameucr)
- Corrección para archivos de configuración con nombre incorrectamente
Actualización de V3: 24 de diciembre de 2021 - Somnai
- Implementado el método de recorte avanzado de Dango
- Modelos de deslizamiento agregados, gracias a NeuralDivergent
- Se solucionó el problema con NANS que resultó en imágenes negras, con ayuda y pruebas masivas de @Softology
- Perlin ahora cambia correctamente dentro de los lotes (no estoy seguro de dónde vino este código Perlin_regen originalmente, pero gracias)
Actualización de V4: enero de 2022 - Somnai
- Zoom de difusión implementado
- Se agregó Chigozie Keyframing
- Hizo un montón de ediciones a los procesos
Actualización de V4.1: 14 de enero de 2022 - Somnai
- Modo de entrada de video agregado
- Licencia agregada que de alguna manera desapareció
- Se agregó una tecla de solicitud mejorada, una imagen fija_prompts y múltiples indicaciones
- UI mejorada
- Significativo bajo la limpieza y mejora del capó
- Valores predeterminados refinados para cada modo
- Modelos de deslizamiento eliminado por el momento debido a conflictos de importación
- Se agregó Superres de difusión latente para afilar
- Modo de ejecución de currículum agregado
Actualización de V5: 20 de febrero 2022 - Gandamu / Adam Letts
- Se agregó el modo de animación 3D. Utiliza una combinación ponderada de modelos de estimación de profundidad adabinas y Midas. Utiliza Pytorch3D para transformaciones 3D en Colab y/o Linux.
Actualización v5.1: 30 de marzo 2022 - Zippy / Chris Allen y Gandamu / Adam Letts
- Características integradas turbo+suaves de Disco Diffusion Turbo, solo la implementación, sin sus valores predeterminados.
- Se implementó el currículum de las animaciones turbo de tal manera que ahora es posible reanudar desde diferentes carpetas de lotes y números de lotes.
- Las unidades de parámetros de rotación 3D ahora son grados (en lugar de radianes)
- Colisión de nombres corregidos en Sampling_Mode (ahora Diffusion_Sample_Mode para PLMS/DDIM, y SAMPLING_MODE para muestreo de transformación 3D)
- Se agregó la opción de video_init_seed_continuity para hacer que las animaciones de video de inicio sean más continuas
- Pytorch3D eliminado de la necesidad de ser compilado con una versión lite específicamente para difusión de disco
- Eliminar la super resolución
- Eliminar modelos de deslizamiento
- Actualización de soporte de plataforma cruzada
Actualización v5.1: 4 de abril 2022 - MSFTServer, también conocido como HostsServer
- Pytorch3D eliminado de la necesidad de ser compilado con una versión lite específicamente para difusión de disco
- Eliminar la super resolución
- Eliminar modelos de deslizamiento
- Actualización de soporte de plataforma cruzada
Actualización v5.2: 10 de abril 2022 - Nin_artificial / Tom Mason
V5.3 Actualización: 10 de junio 2022 - Nshepperd, Huemin, Cut_pow
- Simetría horizontal y vertical
- Adición de modelo Vit-L/14@336px (requiere alto VRAM)
V5.4 Actualización: 14 de junio 2022 - Devdef / Alex Spirin, integrado en DD Main por Gandamu / Adam Letts
- Modo de urdimbre: para resultados de entrada de video suave/continuo aprovechando la estimación del flujo óptico y la mezcla de cuadros
- Soporte de modelos personalizados
V5.5 Actualización: 11 de julio 2022 - Palmweaver / Chris Scalf, Kaliyuga_ai, Integración adicional de Gandamu / Adam Letts
- Integración de modelos OpenClip
- Difusión artística de píxeles, difusión de acuarela y modelos de difusión de ciencia ficción de pulpa
- Programación de Cut_ic_Pow
V5.6 Actualización: 13 de julio 2022 - Felipe3Dartist, Integración de Gandamu / Adam Letts
- Integrated PortraT_Generator_V001 - 512x512 Modelo de difusión entrenado en caras - de Felipe3Dartist
V5.7 Actualización: 31 de diciembre de 2022 - Steffen Moelter (con integración menor de Colab -Convertir por Gandamu)
- Clon Midas V3 específicamente. Esto arregla el modo 3D. Se había roto desde que Midas V3.1 introdujo una incompatibilidad.
Procedencia de cuaderno
Notebook original de Katherine Crowsson (https://github.com/crowsonkb, https://twitter.com/rivershavewings). Utiliza el modelo de difusión 512X512 de Katherine Crowsson o Katherine Crowsson (https://github.com/openai/guided-diffusion), junto con el clip (https://github.com/openai/clip) para conectar) para conectar Informe de texto con imágenes.
Modificado por Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss) para incluir (con suerte) parámetros óptimos para generaciones rápidas en 15-100 temporizas en lugar de 1000, así como más aumentos de robuste .
Otras mejoras de Dango233 y Nshepperd ayudaron a mejorar la calidad de la difusión en general, y especialmente para carreras más cortas como este cuaderno para lograr.
Vark agregó código para cargar en múltiples modelos de clip a la vez, que se evalúan todas las indicaciones, lo que puede mejorar en gran medida la precisión.
Las últimas características de Zoom, Pan, Rotation y Keyframes fueron tomadas del cuaderno de zoom Vqgan de Chigozie NRI (https://github.com/chigozienri, https://twitter.com/chigozienri)
El método avanzado de recorte de DangoCutn también es de Dango223.
-
Somnai (https://twitter.com/somnai_dreams) agregó técnicas de animación de difusión 2D, mejoras en la calidad de vida y diversas implementaciones de tecnología y técnicas, en su mayoría en el cambio de cambios a continuación.
Implementación de animación 3D agregada por Adam Letts (https://twitter.com/gandamu_ml) en colaboración con Somnai.
Turbo Feature de Chris Allen (https://twitter.com/zippy731)
Mejoras a la capacidad de ejecutar en sistemas locales, soporte de Windows e instalación de dependencia por hostsserver (https://twitter.com/hostsserver)
Modo VR por Tom Mason (https://twitter.com/nin_artificial)
Funcionalidad de simetría horizontal y vertical por Nshepperd. Symmetry Transformation_steps de Huemin (https://twitter.com/huemin_art). Integración de simetría en difusión de disco por Dmitrii Tochilkin (https://twitter.com/cut_pow).
Deformación y soporte de modelo personalizado de Alex Spirin (https://twitter.com/devdef).
Difusión de arte de píxeles, difusión de acuarela y modelos de difusión de ciencia ficción de Kaliyuga (https://twitter.com/kaliyuga_ai). Siga el Twitter de Kaliyuga para obtener los últimos modelos y para cuadernos con configuraciones especializadas.
Integración de los modelos OpenClip e iniciación de la integración de los modelos Kaliyuga por Palmweaver/Chris Scalf (https://twitter.com/chrisscalf11)
Integrated PortraT_Generator_V001 de Felipe3Dartist (https://twitter.com/felipe3Dartist)
La versión de la versión MIDAS FIJA por Steffen Moelter (una solución necesaria para el modo de animación 3D después de que se introdujo Midas V3.1).