SwarmUI v0.9.3 Beta .
Anteriormente conhecido como StableSwarmUI.
Uma interface de usuário web modular de geração de imagens de IA, com ênfase em tornar ferramentas elétricas facilmente acessíveis, de alto desempenho e extensibilidade. Suporta difusão estável, fluxo, etc. modelos de imagem de IA, com planos para oferecer suporte a vídeo, áudio de IA e muito mais no futuro.
Junte-se ao Discord para discutir o projeto, obter suporte, ver anúncios, etc.
Siga o tópico de anúncios de recursos para atualizações sobre novos recursos.
Este projeto está em status Beta . Isso significa que para a maioria das tarefas, o Swarm tem ferramentas excelentes disponíveis para você, mas há muito mais planejado. Swarm é recomendado como uma UI ideal para a maioria dos usuários, iniciantes e profissionais. Ainda há algumas coisas a serem resolvidas.
Os usuários iniciantes vão adorar a interface principal da guia Gerar do Swarm, facilitando a geração de qualquer coisa com uma variedade de recursos poderosos. Usuários avançados podem preferir a guia Comfy Workflow para obter o gráfico bruto irrestrito, mas ainda terão motivos para voltar à guia Gerar para obter recursos convenientes (editor de imagens, geração automática de fluxo de trabalho, etc.) e ferramentas elétricas (por exemplo, Grid Generator).
Aqueles interessados em ajudar a levar o Swarm de Beta para um status de lançamento totalmente aperfeiçoado e pronto para qualquer coisa são bem-vindos para enviar PRs (leia o documento de contribuição primeiro), e você pode entrar em contato conosco aqui no GitHub ou no Discord. Eu recomendo fortemente entrar em contato para perguntar sobre os planos para um recurso antes de publicá-lo. Pode já haver planos específicos ou até mesmo um trabalho em andamento.
Principais alvos de recursos ainda não implementados:
Melhor suporte ao navegador móvel
detalhes completos da exibição do "Modelo Atual" na interface do usuário, separado do seletor de modelo (provavelmente como uma guia na barra lateral do lote?)
E uma maneira de alternar dinamicamente as guias entre os locais para conveniência/personalização do layout
Solicitação assistida por LLM
distribuição direta conveniente do Swarm como um programa (aplicativo Electron?)
AVISO : o Google Colab não permite necessariamente WebUIs remotos, especialmente para contas gratuitas, por sua conta e risco.
Link do Colab se você quiser experimentar o Swarm: https://colab.research.google.com/github/mcmonkeyprojects/SwarmUI/blob/master/colab/colab-notebook.ipynb
Modelo Runpod (nota: mantido pelo colaborador terceirizado nerdylive123): https://runpod.io/console/deploy?template=u7mlkrmxq3&ref=c6jd6jj0
Observe que pode levar vários minutos para inicializar pela primeira vez. Verifique os logs do contêiner para ver o progresso da configuração. Verifique o modelo ?
info para dicas sobre como usar.
Observação: se você estiver no Windows 10, talvez seja necessário instalar manualmente o git e o SDK do DotNET 8 primeiro. (Windows 11 isso é automatizado).
Baixe o arquivo Install-Windows.bat, armazene-o em algum lugar onde deseja instalar (não em Program Files
) e execute-o.
Ele deve abrir um prompt de comando e instalar-se.
Se fechar sem prosseguir, tente executá-lo novamente, às vezes é necessário executar duas vezes. (TODO: consertar isso)
Ele colocará um ícone na sua área de trabalho que você pode usar para reiniciar o servidor a qualquer momento.
Quando o instalador for concluído, ele iniciará automaticamente o servidor SwarmUI e abrirá uma janela do navegador para a página de instalação.
Siga as instruções de instalação na página.
Depois de enviar, seja paciente, parte do processamento de instalação leva alguns minutos (download de modelos e etc).
(TODO): Pré-instalador independente ainda mais fácil, um .msi
ou .exe
que fornece uma tela de instalação geral e permite escolher a pasta e tudo.
Instale o git em https://git-scm.com/download/win
Instale o SDK do DotNET 8 em https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (certifique-se de obter o SDK x64 para Windows)
abra um terminal na pasta que você deseja fazer o swarm e execute git clone https://github.com/mcmonkeyprojects/SwarmUI
abra a pasta e execute launch-windows.bat
Instale git
, python3
através do gerenciador de pacotes do seu sistema operacional se eles ainda não estiverem instalados (certifique-se de incluir pip
e venv
em distros que não os incluem diretamente em python)
Por exemplo, em versões recentes do Ubuntu, sudo apt install git python3-pip python3-venv
Baixe o arquivo install-linux.sh, armazene-o em algum lugar onde deseja instalar e execute-o
wget https://github.com/mcmonkeyprojects/SwarmUI/releases/download/0.6.5-Beta/install-linux.sh -O install-linux.sh
chmod +x install-linux.sh
Se você gosta de terminais, pode abrir um terminal na pasta e executar os seguintes comandos:
Execute o script ./install-linux.sh
, ele instalará tudo para você e eventualmente abrirá a página da web em seu navegador.
Siga as instruções de instalação na página.
Você pode, a qualquer momento no futuro, executar o script launch-linux.sh
para reiniciar o Swarm.
Se a página não abrir sozinha, você pode abrir manualmente http://localhost:7801
Instale git
, python3
através do gerenciador de pacotes do seu sistema operacional se eles ainda não estiverem instalados (certifique-se de incluir pip
e venv
em distros que não os incluem diretamente em python)
Por exemplo, em versões recentes do Ubuntu, sudo apt install git python3-pip python3-venv
Instale o DotNET 8 usando as instruções em https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (você precisa dotnet-sdk-8.0
, pois inclui todos os subpacotes relevantes)
Alguns usuários disseram que certas distribuições Linux esperam que aspnet-runtime
seja instalado separadamente
Abra um terminal shell e cd
para um diretório no qual deseja instalar
Execute comandos shell:
git clone https://github.com/mcmonkeyprojects/SwarmUI
cd SwarmUI
./launch-linux.sh
abra http://localhost:7801/Install
(se não iniciar sozinho)
Siga as instruções de instalação na página.
(TODO): Talvez crie um link para um documento dedicado com detalhes por distribuição e tudo mais. Talvez também faça um instalador com um clique para Linux?
Nota : Você só pode executar o SwarmUI em computadores Mac com processadores de silício Apple M1 ou M2 (Mx).
Terminal aberto.
Certifique-se de que seus pacotes brew
estejam atualizados com brew update
.
Verifique sua instalação brew
com brew doctor
. Você não deverá ver nenhum erro na saída do comando.
Instale o .NET para macOS: brew install dotnet
.
Se você não possui Python, instale-o: brew install [email protected]
e brew install virtualenv
Mude o diretório ( cd
) para a pasta onde deseja instalar o SwarmUI.
Clone o repositório SwarmUI GitHub: git clone https://github.com/mcmonkeyprojects/SwarmUI
.
cd SwarmUI
e execute o script de instalação: ./launch-macos.sh
.
A instalação começa agora e baixa os modelos de Difusão Estável da internet. Dependendo da sua conexão com a Internet, isso pode levar vários minutos. Aguarde até que seu navegador abra a janela SwarmUI.
Durante a instalação do SwarmUI, você será solicitado a fornecer o tipo de back-end que deseja usar. Para computadores Mac com M1 ou M2, você pode escolher com segurança o backend ComfyUI e escolher os modelos Stable Diffusion XL Base e Refiner na tela Download Models.
Para encaminhar uma GPU Nvidia, você deve ter o Nvidia Container Toolkit instalado: https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
Abra um terminal shell e cd
para um diretório no qual deseja instalar
Execute comandos shell:
git clone https://github.com/mcmonkeyprojects/SwarmUI
cd SwarmUI
./launch-docker.sh
Abra seu navegador em localhost:7801
Observe que ele encaminhará o diretório Models
e Output
e montará Data
e dlbackend
como volumes persistentes independentes.
Veja a pasta de documentação.
O nome "Swarm" é uma referência à função principal original da UI: permitir que um 'enxame' de GPUs gere imagens para o mesmo usuário ao mesmo tempo (especialmente para grandes gerações de grade). Este é apenas o recurso que inspirou o nome e não o fim de tudo o que é Swarm.
O objetivo geral do SwarmUI é ser um balcão único completo para todas as coisas de Difusão Estável.
Consulte o documento de motivações para motivações sobre escolhas técnicas.
Este projeto:
incorpora uma cópia do 7-zip (LGPL).
tem a capacidade de instalar automaticamente o ComfyUI (GPL).
tem a opção de usar como backend AUTOMATIC1111/stable-diffusion-webui (AGPL).
pode instalar automaticamente christophschuhmann/improved-aesthetic-predictor (Apache2) e yuvalkirstain/PickScore (MIT).
pode instalar automaticamente o git-for-windows (GPLv2).
pode instalar automaticamente pacotes pip MIT/BSD/Apache2/PythonSoftwareFoundation: spandrel, dill, imageio-ffmpeg, opencv-python-headless, matplotlib, rembg, kornia, Cython
pode instalar automaticamente ultralíticos (AGPL) para detecção de rosto YOLOv8
(ou seja, nó SwarmYoloDetection
ou uso de sintaxe <segment:yolo-...>
pode ficar sujeito aos termos AGPL),
pode instalar automaticamente o insightface (MIT) para IP Adapter - Face
usa JSON.NET (MIT), FreneticUtilities (MIT), LiteDB (MIT), ImageSharp (Apache2 sob licença dividida de código aberto)
incorpora cópias de ativos da web de BootStrap (MIT), Select2 (MIT), JQuery (MIT), exifr (MIT).
pode ser usado para instalar alguns pacotes de nós personalizados, que possuem avisos de licença individuais para quaisquer licenças FOSS não puras antes da instalação.
suporta extensões criadas pelo usuário que podem ter suas próprias licenças ou condições legais.
O próprio SwarmUI está sob a licença do MIT, no entanto, alguns usos podem ser afetados pelas licenças variantes GPL dos projetos conectados listados acima e observe que todos os modelos usados têm suas próprias licenças.
(Para atualizações anteriores a junho de 2024)
A Licença MIT (MIT) Copyright (c) 2024 Stability AI
A Licença MIT (MIT)
Copyright (c) 2024 Alex “mcmonkey” Goodwin
É concedida permissão, gratuitamente, a qualquer pessoa que obtenha uma cópia deste software e dos arquivos de documentação associados (o "Software"), para negociar o Software sem restrições, incluindo, sem limitação, os direitos de usar, copiar, modificar, mesclar , publicar, distribuir, sublicenciar e/ou vender cópias do Software e permitir que as pessoas a quem o Software seja fornecido o façam, sujeito às seguintes condições:
O aviso de direitos autorais acima e este aviso de permissão serão incluídos em todas as cópias ou partes substanciais do Software.
O SOFTWARE É FORNECIDO "COMO ESTÁ", SEM GARANTIA DE QUALQUER TIPO, EXPRESSA OU IMPLÍCITA, INCLUINDO, MAS NÃO SE LIMITANDO ÀS GARANTIAS DE COMERCIALIZAÇÃO, ADEQUAÇÃO A UM DETERMINADO FIM E NÃO VIOLAÇÃO. EM NENHUM CASO OS AUTORES OU DETENTORES DE DIREITOS AUTORAIS SERÃO RESPONSÁVEIS POR QUALQUER RECLAMAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, ATO ILÍCITO OU DE OUTRA FORMA, DECORRENTE DE, OU EM CONEXÃO COM O SOFTWARE OU O USO OU OUTRAS NEGOCIAÇÕES NO SOFTWARE.