O Laboratório da Floresta Negra lançou recentemente um novo kit de ferramentas FLUX.1Tools, que visa melhorar a controlabilidade de seu modelo básico de gráfico Vincent FLUX.1 e permitir modificação e recriação precisas de imagens reais e geradas. O kit de ferramentas contém quatro funções principais: FLUX.1Fill (reparo e expansão de imagem), FLUX.1Depth e FLUX.1Canny (usando informações de estrutura de imagem para orientar a geração de imagem), FLUX.1Redux (gerando variantes de imagem). Cada ferramenta fornece versões de código aberto e API e fornece serviços por meio de várias plataformas para fornecer aos usuários uma experiência de edição de imagens mais conveniente e eficiente. A seguir está uma introdução detalhada a cada função.
FLUX.1Tools contém quatro funções principais:
FLUX.1Fill: Esta é uma ferramenta avançada de reparo e expansão de imagens que vai além das ferramentas existentes, como Ideogram2.0 e FLUX-Controlnet-Inpainting da AlimamaCreative de código aberto. FLUX.1Fill pode editar e expandir imagens reais e imagens geradas com base nas descrições de texto e máscaras binárias fornecidas pelo usuário e pode integrar perfeitamente o conteúdo modificado na imagem para obter um efeito natural e suave.
Após os testes, o FLUX.1Fill [pro] supera todos os outros produtos concorrentes, tornando-o o modelo de reparo de imagem mais avançado disponível atualmente. A versão de código aberto FLUX.1Fill [dev] também supera outras soluções proprietárias e é mais eficiente na inferência.
FLUX.1Depth e FLUX.1Canny: Ambas as ferramentas utilizam as informações estruturais da imagem para orientar a geração da imagem, mantendo assim a estrutura original da textura da imagem ao modificá-la.
Entre eles, FLUX.1Depth usa informações de profundidade da imagem para modificação, enquanto FLUX.1Canny usa informações de detecção de borda para orientação, o que é mais adequado para ajuste preciso de detalhes.
Os resultados da avaliação mostram que o FLUX.1Depth supera modelos proprietários, como Midjourney ReTexture, com FLUX.1Depth [pro] fornecendo maior diversidade de saída e FLUX.1Depth [dev] fornecendo mais consistência no resultado das tarefas de percepção de profundidade. Para modelos de detecção de borda, FLUX.1Canny [pro] tem o melhor desempenho, seguido por FLUX.1Canny [dev].
FLUX.1Redux: Este é um adaptador para todos os modelos básicos do FLUX.1 para gerar variações de imagem. Dada uma imagem de entrada, o FLUX.1Redux pode fazer alterações sutis nela, gerar diferentes versões e até mesmo redesenhar a imagem com base nas descrições de texto fornecidas pelo usuário.
Além disso, FLUX.1Redux também suporta ajuste de estilo de imagem por meio de API. Os usuários só precisam fornecer uma imagem e uma descrição de texto. Esse recurso foi integrado ao modelo FLUX1.1[pro] Ultra mais recente, que combina imagens de entrada e dicas de texto para criar saída de 4 megapixels de alta qualidade e suporta proporções flexíveis. Os resultados dos testes mostram que o FLUX.1Redux atinge desempenho de última geração na geração de variantes de imagens.
FLUX.1Tools fornece versão de código aberto e versão API
FLUX.1Tools é fornecido em duas versões: versão de código aberto (FLUX.1[dev]) e versão API (FLUX.1[pro]). A versão API de cada ferramenta é lançada como a variante FLUX.1[pro], enquanto a versão de código aberto é lançada como a variante de destilação guiada FLUX.1[dev], com código de inferência e pesos fornecidos. Além disso, o Black Forest Labs anunciou que seus modelos publicados estarão disponíveis através de seus parceiros fal.ai, Replicate, Together.ai, Freepik e krea.ai.
O Black Forest Lab afirmou que o kit de ferramentas FLUX.1Tools lançado desta vez irá injetar nova vitalidade no ecossistema Flux, e eles esperam ver os usuários da comunidade criarem trabalhos mais interessantes usando essas novas ferramentas.
Modelo: https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev
Introdução detalhada: https://blackforestlabs.ai/flux-1-tools/
Resumindo, o kit de ferramentas FLUX.1Tools trouxe novos avanços no campo de edição e criação de imagens com suas funções avançadas e desempenho eficiente. Vale a pena esperar por mais possibilidades em aplicações futuras. Os desenvolvedores podem acessar os links fornecidos para obter mais informações e recursos.