A IA de estabilidade libera um novo modelo estável de difusão 3.5 de geração, três versões e uma grande melhoria de velocidade - artigos de IA

Autor：Eve Cole Data da Última Atualização：2025-02-12 15:00:03

A estabilidade da AI anuncia o lançamento do estável Difusão 3.5, uma série de três versões diferentes de grandes modelos de geração de texto para texto. A série pretende atender à ampla gama de necessidades, de pesquisadores a clientes corporativos e entusiastas, fornecendo modelos de diferentes escalas de parâmetros e características de desempenho para atender a diferentes recursos de computação e cenários de aplicativos. A atualização visa responder a deficiências anteriores do estável Difusão 3.0 e competir com outras ferramentas principais de geração de imagens de IA no mercado.

A IA de estabilidade lançou recentemente seu mais recente modelo de geração de texto para imagem de aprendizado profundo-Difusão estável3.5. Este lançamento inclui três modelos aprimorados de código aberto projetados para atender às necessidades de diferentes usuários, incluindo pesquisadores, clientes corporativos e entusiastas.

Entre eles, a difusão estável3.5large é o modelo mais poderoso de toda a série, com parâmetros de até 8,1 bilhões. Com sua excelente qualidade de imagem e alta capacidade de resposta às instruções, o modelo é ideal para usuários profissionais, capaz de gerar imagens de alta qualidade com uma resolução de até 1 megapixel.

Além disso, a difusão estável3.5large turbo é uma versão simplificada do estável difusão3.5large. Ao gerar imagens de alta qualidade, ele melhora bastante a velocidade.

Outro novo modelo é a difusão estável3.5medium, que possui 2,5 bilhões de parâmetros. O modelo adota um método aprimorado de arquitetura e treinamento do MMDIT-X, projetado para estar "fora do lado" e é executado sem problemas, mesmo no hardware do consumidor. Ele atinge um bom equilíbrio entre a qualidade da geração de imagens e a facilidade de personalização, produzindo imagens de 0,25 a 2 megapixels.

O pano de fundo deste lançamento é que, após o lançamento de junho do estável Difusão3Medium falhou em atender às expectativas, a estabilidade da IA decidiu lançar uma solução mais transformadora. A empresa disse que espera recuperar a competitividade do mercado com a atualização para enfrentar desafios de plataformas como o Dall-E e Midjourney, do Openai.

Uma importante inovação tecnológica no novo modelo é a introdução da tecnologia de normalização da chave de consulta. Essa inovação aprimora a personalização do modelo e a capacidade de resposta às instruções, e os usuários podem obter resultados mais consistentes com instruções claras, além de obter uma interpretação de imagem mais rica ao usar instruções mais amplas.

O modelo estável Difusão3.5 da série será lançado sob a licença comunitária da estabilidade da IA, permitindo que os usuários usem não comercialmente gratuitamente. Ao mesmo tempo, entidades com renda anual inferior a US $ 1 milhão também podem ser usadas para uso comercial gratuitamente, enquanto os usuários com excesso de renda devem solicitar uma licença corporativa.

Todos os modelos e seus pesos auto-hospedeiros são fornecidos no rosto abraçando e nas APIs da AI. Além disso, o recurso ControlNets, que oferece opções avançadas de personalização de imagens, deve ser lançado nos próximos dias.

Entrada oficial:

https://stability.ai/stable-image

Três versões de portais de rosto abraçados:

https://huggingface.co/stabilityai/stable-diffusion-3.5-large

https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

Pontos -chave:

O recém -lançado Difusão estável3.5 oferece três versões modelo para atender às diferentes necessidades do usuário.

Difusão estável3.5Large O turbo possui velocidades de geração de imagem mais rápidas, adequadas para criação rápida.

O novo modelo apresenta a tecnologia de normalização da chave de consulta, que melhora a personalização e a capacidade de resposta.

Em resumo, o lançamento do modelo estável da série 3.5 marca uma grande atualização da AI de estabilidade no campo da geração de texto para imagem. na feroz concorrência do mercado. Visite os links fornecidos e experimente a nova tecnologia de geração de imagens!