Relatórios do editor de downcodes: A equipe criativa da Alimama lançou um novo modelo de geração de imagem FLUX.1-Turbo-Alpha, que é um modelo Lora destilado de 8 etapas baseado no treinamento do modelo FLUX.1-dev. Este modelo usa um discriminador multi-head, que melhora significativamente a qualidade da geração de imagem. Ele suporta múltiplas funções, como geração de texto para imagem, rede de controle de reparo, etc., e é compatível com as estruturas Difusores e ComfyUI, tornando-o. fácil para os usuários começarem rapidamente. O modelo é treinado de forma adversa em milhões de dados de imagem de alta qualidade. A pontuação estética excede 6,3 e a resolução é superior a 800, garantindo saída de imagem de alta qualidade. O que é ainda mais emocionante é que uma versão com degraus mais baixos será lançada no futuro.
Recentemente, a equipe criativa da Alimama lançou o FLUX.1-Turbo-Alpha, um modelo Lora de destilação em 8 etapas treinado com base no modelo FLUX.1-dev.
Este modelo utiliza um discriminador de múltiplas cabeças, que melhora significativamente a qualidade da destilação e suporta uma variedade de aplicações relacionadas ao FLUX, como geração de texto para imagem e redes de controle de reparo. A equipe recomenda definir a escala do guia para 3,5 e a escala Lora para 1 ao usá-la. Uma versão com menor número de etapas será lançada no futuro.
FLUX.1-Turbo-Alpha pode ser usado diretamente com a estrutura Difusores. Os usuários podem carregar o modelo e gerar as imagens necessárias com apenas algumas linhas de código. Por exemplo, você pode criar uma cena divertida de uma preguiça sorridente vestindo uma jaqueta de couro, chapéu de cowboy, saia xadrez e laço, parada na frente de uma elegante van Volkswagen pintada com uma paisagem urbana. Simplesmente ajustando os parâmetros, você pode gerar imagens de alta qualidade com resolução de 1024x1024.
Além disso, o modelo também é compatível com ComfyUI e pode ser usado para fluxos de trabalho rápidos de texto para imagem ou para obter efeitos de geração mais eficientes em redes de controle de reparos. Através desta tecnologia, as imagens geradas podem acompanhar de perto a saída original, melhorando a experiência criativa do usuário.
O processo de treinamento do FLUX.1-Turbo-Alpha é igualmente impressionante. O modelo foi treinado em mais de 1 milhão de imagens de código aberto e fontes internas, com pontuação estética superior a 6,3, todas em resoluções acima de 800. A equipe adotou um método de treinamento adversário durante o processo de treinamento para melhorar a qualidade da imagem e adicionou um design de múltiplos cabeçotes para cada camada do transformador. A escala de bootstrap durante o treinamento foi fixada em 3,5, o deslocamento de tempo foi definido como 3, a precisão mista bf16 foi usada, a taxa de aprendizado foi definida como 2e-5, o tamanho do lote foi 64 e o tamanho da imagem foi 1024x1024.
O lançamento do FLUX.1-Turbo-Alpha marca mais um avanço da Alimama na área de geração de imagens, promovendo a popularização e aplicação da tecnologia de inteligência artificial.
Entrada do projeto: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
Destaque:
Este modelo é baseado no FLUX.1-dev e usa destilação em 8 etapas e discriminador de múltiplas cabeças para melhorar a qualidade da geração de imagem.
Suportando geração de texto para imagem e redes de controle de reparo, os usuários podem criar facilmente uma variedade de cenas interessantes.
? O processo de treinamento usa treinamento adversário e os dados de treinamento excedem 1 milhão de imagens para garantir resultados de alta qualidade do modelo.
Resumindo, o FLUX.1-Turbo-Alpha traz novas possibilidades para o campo da geração de imagens com sua alta eficiência, recursos de geração de imagens de alta qualidade e recursos convenientes e fáceis de usar. Os usuários interessados podem acessar a página Hugging Face para experimentar este modelo poderoso. O editor do Downcodes continuará prestando atenção aos mais recentes progressos do Alibaba no campo da inteligência artificial e trazendo a você relatórios mais interessantes.