O editor do Downcodes soube que Stability AI lançou seu mais recente e poderoso modelo de geração de imagens, Stable Diffusion 3.5. Este modelo não é uma versão única, mas contém três versões para atender às necessidades de diferentes usuários, desde pesquisadores científicos até usuários corporativos. pode se beneficiar disso. Estas três versões têm ênfase diferente na quantidade de parâmetros, velocidade de execução e hardware aplicável, proporcionando aos usuários uma gama mais ampla de opções.
Ontem à noite, Stability AI lançou seu modelo mais poderoso - Stable Diffusion 3.5. Este não é apenas um modelo único, mas um balde familiar contendo três versões, projetado para satisfazer a todos, desde pesquisadores científicos a diversas necessidades de startups e empresas.
As três versões são Stable Diffusion3.5Large, Stable Diffusion3.5Large Turbo e Stable Diffusion3.5Medium, que serão lançadas em 29 de outubro.
Stable Diffusion3.5Large é um modelo básico de 8 bilhões de parâmetros conhecido por sua excelente qualidade de imagem e precisão de palavras-chave, tornando-o ideal para uso profissional e capaz de produzir imagens com resolução de até 1 megapixel.
Stable Diffusion3.5Large Turbo é uma versão destilada do anterior, que é capaz de gerar imagens de alta qualidade em apenas 4 etapas, muito mais rápido que Stable Diffusion3.5Large.
Stable Diffusion3.5Medium tem 2,5 bilhões de parâmetros, usa uma arquitetura MMDiT-X aprimorada e método de treinamento, é projetado para ser plug-and-play, pode ser executado diretamente em hardware de consumo, equilibra qualidade de imagem e personalização e pode gerar imagens de resolução com taxas entre 0,25 e 2 megapixels.
Esses modelos foram desenvolvidos priorizando a customização, integrando a Query-Key Normalization no bloco transformador, estabilizando o processo de treinamento do modelo e simplificando ainda mais o ajuste fino e o desenvolvimento. Para apoiar a flexibilidade nas tarefas posteriores, a Stability AI mantém uma base de conhecimento mais ampla e diversos estilos no modelo, embora isso possa levar a um aumento da incerteza nos resultados finais.
O modelo Stable Diffusion3.5 se destaca em vários aspectos, incluindo personalização, desempenho eficiente e resultados diversificados. Esses modelos podem ser facilmente ajustados para atender às necessidades específicas de criação ou criar aplicativos com base em fluxos de trabalho personalizados. Eles também são otimizados para serem executados em hardware padrão de consumo, sem requisitos excessivos de hardware. Além disso, esses modelos são capazes de criar imagens que representam o mundo inteiro sem a necessidade de palavras extensas, ao mesmo tempo em que são capazes de gerar imagens em uma variedade de estilos e estéticas, como 3D, fotografia, pintura, arte linear e praticamente qualquer visual. estilo imaginável.
A Stability AI também enfatizou o seu compromisso com a segurança, tomando medidas razoáveis para evitar o uso indevido da Difusão Estável 3.5 e concentrando-se na integridade desde os estágios iniciais de desenvolvimento. Além disso, a licença comunitária Stability AI é muito permissiva, permitindo que indivíduos e organizações usem o modelo gratuitamente para uso não comercial, incluindo pesquisa científica. O modelo também é gratuito para uso comercial por startups, PMEs e criadores com receita anual de até US$ 1 milhão. A propriedade da mídia resultante não é afetada por licenças restritivas.
O modelo Stable Diffusion3.5 já está disponível para auto-hospedagem no Hugging Face, e o código de inferência também é de código aberto. Além disso, o modelo pode ser acessado por meio de plataformas como Stability AI API, Replicate, ComfyUI e DeepInfra.
Endereço da experiência: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
Em suma, os modelos da série Stable Diffusion 3.5 fizeram progressos significativos em qualidade de imagem, velocidade de geração e facilidade de uso, fornecendo aos usuários recursos poderosos de geração de imagens e cenários de aplicação flexíveis. O editor do Downcodes recomenda a todos os leitores que experimentem e sintam seu poderoso desempenho.