El modelo grande Hunyuan DiT de Tencent (HunyuanDiT) continúa actualizándose de forma iterativa, brindando a los usuarios capacidades de generación de imágenes más potentes. El editor de Downcodes se enteró de que HunyuanDiT y la comunidad lanzaron recientemente tres nuevos complementos controlables, ControlNet, a saber, mosaico (amplificación de alta definición), inpainting (reparación y expansión de imágenes) y lineal (dibujo lineal), que mejoran significativamente el rendimiento del modelo. Gama de aplicaciones y libertad creativa. La incorporación de estos complementos permite a Hunyuan DiT mostrar un mayor potencial de aplicación en los campos del arte, la creatividad, la arquitectura y otros campos, brindando servicios de generación de imágenes más precisos y convenientes a desarrolladores y creadores de todo el mundo.
El modelo grande HunyuanDiT de Tencent (HunyuanDiT) se asoció recientemente con la comunidad para lanzar tres nuevos complementos controlables, ControlNet, a saber, mosaico (amplificación de alta definición), inpainting (reparación y expansión de imágenes) y lineal (dibujo lineal), para expandirse aún más. Su matriz ControlNet. La incorporación de estos complementos permite que el modelo Hunyuan DiT cubra una gama más amplia de escenarios de aplicaciones, incluido el 80% de casos y escenarios como arte, creatividad, arquitectura, fotografía, belleza y comercio electrónico, proporcionando empresas globales y desarrolladores individuales. y creadores Proporciona una generación de imágenes más precisa y una mayor libertad creativa.
El complemento Tile puede ampliar la información de la imagen y lograr una amplificación ultra clara, alcanzando incluso una resolución de 4K a 8K, que es adecuada para escenas que requieren la máxima búsqueda de detalles de la imagen. El complemento Inpainting puede rellenar las partes manchadas y moteadas de la imagen según las necesidades del creador, lograr efectos como reemplazo de fondo y cambio de sujeto de personaje, y manejar el redibujado de imágenes de áreas grandes. El complemento Lineart utiliza diferentes tipos de líneas para crear imágenes arquitectónicas, animadas y de la vida real, y es adecuado para generar representaciones arquitectónicas y colorear manuscritos.
Además, Tencent Hunyuan DiT ha lanzado anteriormente modelos ControlNet con astucia (borde), profundidad (profundidad), pose (postura humana) y otras condiciones para ayudar a los desarrolladores en el razonamiento, y ha abierto el programa de capacitación ControlNet para permitir a los desarrolladores y creadores Capacidad para entrenar modelos ControlNet personalizados.
Desde que anunció una actualización integral y código abierto en mayo, Hunyuan DiT, como el primer modelo de generación de gráficos de código abierto con arquitectura DiT nativa de China de la industria, ha seguido construyendo un ecosistema de desarrolladores y ha lanzado una biblioteca de aceleración exclusiva para mejorar la eficiencia del razonamiento y acortar la generación de gráficos. tiempo Y además abrió el código de inferencia. En julio, Hunyuan DiT se actualizó a la versión 1.2 y se abrió una versión pequeña de memoria de video. Solo requiere 6G de memoria de video para ejecutarse, lo que la hace más amigable para los desarrolladores implementada localmente en computadoras personales.
Actualmente, Hunyuan DiT tiene más de 3,1 mil estrellas en Github, lo que lo convierte en el modelo de código abierto DiT nacional más popular.
Sitio web oficial
https://dit.hunyuan.tencent.com/
código
https://github.com/Tencent/HunyuanDiT
Modelo
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
papel
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Con todo, las actualizaciones continuas y la estrategia de código abierto de Tencent Hunyuan DiT brindan a los desarrolladores y creadores herramientas y recursos poderosos, y promueven el progreso y el desarrollo de la tecnología Wenshengtu. Vale la pena esperar más innovaciones y avances en el futuro.