O modelo grande Hunyuan DiT da Tencent (HunyuanDiT) continua a ser atualizado iterativamente, trazendo aos usuários recursos de geração de imagens mais poderosos. O editor do Downcodes soube que HunyuanDiT e a comunidade lançaram recentemente três novos plug-ins controláveis, ControlNet, nomeadamente tile (amplificação de alta definição), inpainting (reparação e expansão de imagem) e lineart (desenho de linha), o que melhora significativamente o desempenho do modelo . Gama de aplicações e liberdade criativa. A adição desses plug-ins permite que a Hunyuan DiT mostre um potencial de aplicação mais forte nas áreas de arte, criatividade, arquitetura e outras áreas, fornecendo serviços de geração de imagens mais precisos e convenientes para desenvolvedores e criadores em todo o mundo.
O grande modelo HunyuanDiT da Tencent (HunyuanDiT) recentemente se uniu à comunidade para lançar três novos plug-ins controláveis, ControlNet, ou seja, ladrilho (amplificação de alta definição), pintura interna (reparo e expansão de imagem) e lineart (desenho de linha), para expandir ainda mais Sua matriz ControlNet. A adição desses plug-ins permite que o modelo Hunyuan DiT cubra uma ampla gama de cenários de aplicação, incluindo 80% dos casos e cenários como arte, criatividade, arquitetura, fotografia, beleza e comércio eletrônico, fornecendo às empresas globais e aos desenvolvedores individuais e criadores com Fornece geração de imagens mais precisa e maior liberdade criativa.
O plug-in Tile pode expandir as informações da imagem e obter uma amplificação ultranítida, atingindo até mesmo resolução de 4K a 8K, o que é adequado para cenas que exigem a busca máxima pelos detalhes da imagem. O plug-in Inpainting pode preencher as partes manchadas e manchadas da imagem de acordo com as necessidades do criador, obter efeitos como substituição de fundo e mudança de assunto de personagem e lidar com o redesenho de imagens em grandes áreas. O plug-in Lineart usa diferentes tipos de linhas para criar imagens reais, animadas e arquitetônicas, e é adequado para gerar representações arquitetônicas e colorir manuscritos.
Além disso, Tencent Hunyuan DiT lançou anteriormente modelos ControlNet com astúcia (borda), profundidade (profundidade), pose (postura humana) e outras condições para apoiar os desenvolvedores no raciocínio, e abriu o código-fonte do programa de treinamento ControlNet para permitir que desenvolvedores e criadores Capacidade de treinar modelos ControlNet personalizados.
Desde o anúncio de uma atualização abrangente e de código aberto em maio, Hunyuan DiT, como o primeiro modelo de geração de gráficos de código aberto de arquitetura DiT nativa chinesa da indústria, continuou a construir um ecossistema de desenvolvedores e lançou uma biblioteca de aceleração exclusiva para melhorar a eficiência do raciocínio e reduzir a geração de gráficos tempo. E abrir ainda mais o código de inferência. Em julho, Hunyuan DiT foi atualizado para a versão 1.2, e uma pequena versão de memória de vídeo foi de código aberto. Requer apenas 6G de memória de vídeo para funcionar, tornando-o mais amigável para desenvolvedores implantados localmente em computadores pessoais.
Atualmente, Hunyuan DiT tem mais de 3,1 mil estrelas no Github, tornando-o o modelo de código aberto DiT doméstico mais popular.
Site oficial
https://dit.hunyuan.tencent.com/
código
https://github.com/Tencent/HunyuanDiT
Modelo
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
papel
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Em suma, as atualizações contínuas e a estratégia de código aberto da Tencent Hunyuan DiT fornecem aos desenvolvedores e criadores ferramentas e recursos poderosos e promovem o progresso e o desenvolvimento da tecnologia Wenshengtu. Vale a pena esperar mais inovações e avanços no futuro.