SwarmUI v0.9.3 Beta .
Anteriormente conocido como StableSwarmUI.
Una interfaz web de usuario modular de generación de imágenes de IA, con énfasis en hacer que las herramientas eléctricas sean fácilmente accesibles, de alto rendimiento y extensibles. Admite modelos de imágenes de IA de difusión estable, flujo, etc., con planes para admitir video, audio y más de IA en el futuro.
Únase a Discord para discutir el proyecto, obtener soporte, ver anuncios, etc.
Siga el hilo de anuncios de funciones para obtener actualizaciones sobre nuevas funciones.
Este proyecto se encuentra en estado Beta . Esto significa que para la mayoría de las tareas, Swarm tiene excelentes herramientas disponibles, pero hay mucho más planificado. Se recomienda Swarm como una interfaz de usuario ideal para la mayoría de los usuarios, tanto principiantes como profesionales. Todavía quedan algunas cosas por resolver.
A los usuarios principiantes les encantará la interfaz de la pestaña Generar principal de Swarm, lo que facilita generar cualquier cosa con una variedad de potentes funciones. Los usuarios avanzados pueden preferir la pestaña Comfy Workflow para obtener el gráfico sin formato sin restricciones, pero aún tendrán motivos para volver a la pestaña Generar para funciones de conveniencia (editor de imágenes, generación automática de flujo de trabajo, etc.) y herramientas eléctricas (por ejemplo, Generador de cuadrículas).
Aquellos interesados en ayudar a impulsar a Swarm desde Beta a un estado de lanzamiento completamente listo para cualquier cosa, pueden enviar PR (lea primero el documento de contribución) y pueden contactarnos aquí en GitHub o en Discord. Recomiendo encarecidamente comunicarse para preguntar sobre los planes para una función antes de publicarla. Es posible que ya existan planes específicos o incluso un trabajo en progreso.
Objetivos de funciones clave aún no implementados:
Mejor soporte para navegadores móviles
Visualización detallada del "Modelo actual" en la interfaz de usuario, separada del selector de modelo (¿probablemente como una pestaña dentro de la barra lateral del lote?)
Y una forma de cambiar dinámicamente las pestañas entre puntos para mayor comodidad/personalización del diseño.
indicaciones asistidas por LLM
conveniente distribución directa de Swarm como programa (¿aplicación Electron?)
ADVERTENCIA : Google Colab no necesariamente permite el uso de WebUI remotas, especialmente para cuentas gratuitas, bajo su propio riesgo.
Enlace de Colab si quieres probar Swarm: https://colab.research.google.com/github/mcmonkeyprojects/SwarmUI/blob/master/colab/colab-notebook.ipynb
Plantilla Runpod (nota: mantenida por el colaborador externo nerdylive123): https://runpod.io/console/deploy?template=u7mlkrmxq3&ref=c6jd6jj0
Tenga en cuenta que puede tardar varios minutos en iniciarse la primera vez. Consulte los registros del contenedor para ver el progreso de la configuración. ¿Consultar la plantilla ?
información para obtener sugerencias sobre cómo utilizarlo.
Nota: si utiliza Windows 10, es posible que primero deba instalar manualmente git y DotNET 8 SDK. (Windows 11 esto está automatizado).
Descargue el archivo Install-Windows.bat, guárdelo en algún lugar donde desee instalarlo (no en Program Files
) y ejecútelo.
Debería abrir un símbolo del sistema e instalarse.
Si se cierra sin ir más lejos, intenta ejecutarlo nuevamente, a veces es necesario ejecutarlo dos veces. (TODO: Arreglar eso)
Colocará un ícono en su escritorio que podrá usar para reiniciar el servidor en cualquier momento.
Cuando se complete el instalador, iniciará automáticamente el servidor SwarmUI y abrirá una ventana del navegador en la página de instalación.
Siga las instrucciones de instalación en la página.
Después de enviar, tenga paciencia, algunos procesos de instalación demoran unos minutos (descarga de modelos, etc.).
(TODO): Preinstalador autónomo aún más fácil, un .msi
o .exe
que proporciona una pantalla de instalación general y le permite elegir la carpeta y todo.
Instale git desde https://git-scm.com/download/win
Instale DotNET 8 SDK desde https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (Asegúrese de obtener el SDK x64 para Windows)
abra una terminal en la carpeta en la que desea swarm y ejecute git clone https://github.com/mcmonkeyprojects/SwarmUI
abra la carpeta y ejecute launch-windows.bat
Instale git
, python3
a través del administrador de paquetes de su sistema operativo si aún no están instalados (asegúrese de incluir pip
y venv
en distribuciones que no los incluyen directamente en python)
Por ejemplo, en versiones recientes de Ubuntu, sudo apt install git python3-pip python3-venv
Descargue el archivo install-linux.sh, guárdelo en algún lugar donde desee instalarlo y ejecútelo
wget https://github.com/mcmonkeyprojects/SwarmUI/releases/download/0.6.5-Beta/install-linux.sh -O install-linux.sh
chmod +x install-linux.sh
Si le gustan las terminales, puede abrir una terminal en la carpeta y ejecutar los siguientes comandos:
Ejecute el script ./install-linux.sh
, instalará todo por usted y eventualmente abrirá la página web en su navegador.
Siga las instrucciones de instalación en la página.
En cualquier momento futuro, puede ejecutar el script launch-linux.sh
para reiniciar Swarm.
Si la página no se abre sola, puede abrir manualmente http://localhost:7801
Instale git
, python3
a través del administrador de paquetes de su sistema operativo si aún no están instalados (asegúrese de incluir pip
y venv
en distribuciones que no los incluyen directamente en python)
Por ejemplo, en versiones recientes de Ubuntu, sudo apt install git python3-pip python3-venv
Instale DotNET 8 siguiendo las instrucciones en https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (necesita dotnet-sdk-8.0
, ya que incluye todos los subpaquetes relevantes)
Algunos usuarios han dicho que ciertas distribuciones de Linux esperan que aspnet-runtime
se instale por separado.
Abra una terminal de shell y cd
a un directorio en el que desea instalar
Ejecute comandos de shell:
git clone https://github.com/mcmonkeyprojects/SwarmUI
cd SwarmUI
./launch-linux.sh
abra http://localhost:7801/Install
(si no se inicia solo)
Siga las instrucciones de instalación en la página.
(TODO): Tal vez vincular un documento dedicado con detalles por distribución y lo que sea. ¿Quizás también crear un instalador de un solo clic para Linux?
Nota : Solo puede ejecutar SwarmUI en computadoras Mac con procesadores Apple Silicon M1 o M2 (Mx).
Terminal abierta.
Asegúrese de que sus paquetes brew
estén actualizados con brew update
.
Verifique su instalación brew
con brew doctor
. No debería ver ningún error en la salida del comando.
Instale .NET para macOS: brew install dotnet
.
Si no tiene Python, instálelo: brew install [email protected]
y brew install virtualenv
Cambie el directorio ( cd
) a la carpeta donde desea instalar SwarmUI.
Clona el repositorio SwarmUI GitHub: git clone https://github.com/mcmonkeyprojects/SwarmUI
.
cd SwarmUI
y ejecute el script de instalación: ./launch-macos.sh
.
La instalación comienza ahora y descarga los modelos de Stable Diffusion de Internet. Dependiendo de su conexión a Internet, esto puede tardar varios minutos. Espere a que su navegador web abra la ventana de SwarmUI.
Durante la instalación de SwarmUI, se le solicitará el tipo de backend que desea utilizar. Para computadoras Mac con M1 o M2, puede elegir de forma segura el backend de ComfyUI y elegir los modelos Stable Diffusion XL Base y Refiner en la pantalla Descargar modelos.
Para reenviar una GPU Nvidia, debe tener instalado Nvidia Container Toolkit: https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
Abra una terminal de shell y cd
a un directorio en el que desea instalar
Ejecute comandos de shell:
git clone https://github.com/mcmonkeyprojects/SwarmUI
cd SwarmUI
./launch-docker.sh
Abra su navegador en localhost:7801
Tenga en cuenta que reenviará el directorio Models
y Output
, y montará Data
y dlbackend
como volúmenes persistentes independientes.
Ver la carpeta de documentación.
El nombre "Swarm" hace referencia a la función clave original de la interfaz de usuario: permitir que un "enjambre" de GPU genere imágenes para el mismo usuario a la vez (especialmente para generaciones de cuadrículas grandes). Esta es sólo la característica que inspiró el nombre y no el final de lo que es Swarm.
El objetivo general de SwarmUI es ser una ventanilla única con todas las funciones para todo lo relacionado con la difusión estable.
Consulte el documento de motivaciones para conocer las motivaciones sobre las opciones técnicas.
Este proyecto:
incorpora una copia de 7-zip (LGPL).
tiene la capacidad de instalar automáticamente ComfyUI (GPL).
tiene la opción de utilizar como backend AUTOMATIC1111/stable-diffusion-webui (AGPL).
Puede instalar automáticamente christophschuhmann/improved-aesthetic-predictor (Apache2) y yuvalkirstain/PickScore (MIT).
Puede instalar automáticamente git-for-windows (GPLv2).
puede instalar automáticamente paquetes pip MIT/BSD/Apache2/PythonSoftwareFoundation: spandrel, dill, imageio-ffmpeg, opencv-python-headless, matplotlib, rembg, kornia, Cython
puede instalar automáticamente ultralíticos (AGPL) para la detección de rostros YOLOv8
(es decir, el nodo SwarmYoloDetection
o el uso de la sintaxis <segment:yolo-...>
puede estar sujeto a los términos de AGPL),
puede instalar automáticamente insightface (MIT) para IP Adapter - Face
utiliza JSON.NET (MIT), FreneticUtilities (MIT), LiteDB (MIT), ImageSharp (Apache2 bajo licencia dividida de código abierto)
incorpora copias de recursos web de BootStrap (MIT), Select2 (MIT), JQuery (MIT), exifr (MIT).
se puede utilizar para instalar algunos paquetes de nodos personalizados, que tienen avisos de licencia individuales para cualquier licencia que no sea exclusivamente FOSS antes de la instalación.
admite extensiones creadas por el usuario que pueden tener sus propias licencias o condiciones legales.
SwarmUI en sí está bajo la licencia MIT; sin embargo, algunos usos pueden verse afectados por las licencias variantes GPL de los proyectos conectados enumerados anteriormente, y tenga en cuenta que cualquier modelo utilizado tiene sus propias licencias.
(Para actualizaciones anteriores a junio de 2024)
La licencia MIT (MIT) Copyright (c) 2024 Estabilidad AI
La licencia MIT (MIT)
Copyright (c) 2024 Alex "mcmonkey" Goodwin
Por el presente se otorga permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para operar con el Software sin restricciones, incluidos, entre otros, los derechos de uso, copia, modificación, fusión. , publicar, distribuir, sublicenciar y/o vender copias del Software, y permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:
El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, PERO NO LIMITADO A, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN PROPÓSITO PARTICULAR Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGÚN RECLAMO, DAÑO U OTRA RESPONSABILIDAD, YA SEA EN UNA ACCIÓN CONTRACTUAL, AGRAVIO O DE OTRA MANERA, QUE SURJA DE, FUERA DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS NEGOCIOS EN EL SOFTWARE.