Большая модель Hunyuan DiT (HunyuanDiT) от Tencent продолжает итеративно обновляться, предоставляя пользователям более мощные возможности создания изображений. Редактор Downcodes узнал, что HunyuanDiT и сообщество недавно выпустили три новых управляемых плагина ControlNet, а именно tile (усиление высокой четкости), inpainting (восстановление и расширение изображения) и Lineart (рисование линий), что значительно повышает производительность модели. Широкий спектр применения и свобода творчества. Добавление этих плагинов позволяет Hunyuan DiT продемонстрировать более сильный потенциал приложений в области искусства, творчества, архитектуры и других областях, предоставляя более точные и удобные услуги по созданию изображений разработчикам и создателям по всему миру.
Большая модель HunyuanDiT от Tencent (HunyuanDiT) недавно объединилась с сообществом, чтобы выпустить три новых управляемых плагина ControlNet, а именно tile (усиление высокой четкости), inpainting (восстановление и расширение изображения) и Lineart (рисование линий), для дальнейшего расширения. Это матрица ControlNet. Добавление этих плагинов позволяет модели Hunyuan DiT охватить более широкий спектр сценариев применения, включая 80% случаев и сценариев, таких как искусство, творчество, архитектура, фотография, красота и электронная коммерция, предоставляя глобальным предприятиям и отдельным разработчикам и создателей с Обеспечивает более точное создание изображений и большую свободу творчества.
Плагин Tile может расширить информацию об изображении и добиться сверхчеткого усиления, вплоть до разрешения от 4K до 8K, что подходит для сцен, требующих максимальной детализации изображения. Плагин Inpainting может заполнять размазанные и пятнистые части изображения в соответствии с потребностями создателя, достигать таких эффектов, как замена фона и изменение предмета персонажа, а также обрабатывать перерисовку изображения большой площади. Плагин Lineart использует различные типы линий для создания реальных, анимационных и архитектурных изображений и подходит для создания архитектурных визуализаций и раскрасок.
Кроме того, Tencent Hunyuan DiT ранее выпустила модели ControlNet с канни (краем), глубиной (глубиной), позой (позой человека) и другими условиями для поддержки разработчиков в рассуждениях, а также открыла исходный код программы обучения ControlNet, чтобы дать разработчикам и создателям возможность Возможность обучения пользовательских моделей ControlNet.
С момента объявления о комплексном обновлении и открытом исходном коде в мае, Hunyuan DiT, первая в отрасли модель генерации графов с открытым исходным кодом на китайской архитектуре DiT, продолжила создавать экосистему разработчиков и выпустила эксклюзивную библиотеку ускорения для повышения эффективности рассуждений и сокращения времени создания графиков. time И далее открыл исходный код вывода. В июле Hunyuan DiT был обновлен до версии 1.2, а небольшая версия видеопамяти была открыта. Для ее работы требуется всего 6 ГБ видеопамяти, что делает ее более удобной для разработчиков, развернутых локально на персональных компьютерах.
В настоящее время Hunyuan DiT имеет более 3,1 тыс. звезд на Github, что делает его самой популярной отечественной моделью DiT с открытым исходным кодом.
Официальный сайт
https://dit.hunyuan.tencent.com/
код
https://github.com/Tencent/HunyuanDiT
Модель
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
бумага
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
В целом, постоянные обновления Tencent Hunyuan DiT и стратегия открытого исходного кода предоставляют разработчикам и создателям мощные инструменты и ресурсы, а также способствуют прогрессу и развитию технологии Wenshengtu. В будущем стоит ожидать новых инноваций и прорывов.