Model besar Hunyuan DiT (HunyuanDiT) milik Tencent terus diperbarui secara berulang, sehingga menghadirkan kemampuan pembuatan gambar yang lebih canggih kepada pengguna. Editor Downcodes mengetahui bahwa HunyuanDiT dan komunitasnya baru-baru ini merilis tiga plug-in baru yang dapat dikontrol, ControlNet, yaitu ubin (amplifikasi definisi tinggi), inpainting (perbaikan dan perluasan gambar) dan lineart (gambar garis), yang secara signifikan meningkatkan kinerja model . Rentang aplikasi dan kebebasan berkreasi. Penambahan plug-in ini memungkinkan Hunyuan DiT untuk menunjukkan potensi aplikasi yang lebih kuat di bidang seni, kreativitas, arsitektur, dan bidang lainnya, menyediakan layanan pembuatan gambar yang lebih akurat dan nyaman bagi pengembang dan pencipta di seluruh dunia.
Model besar HunyuanDiT (HunyuanDiT) Tencent baru-baru ini bekerja sama dengan komunitas untuk merilis tiga plug-in baru yang dapat dikontrol, ControlNet, yaitu ubin (amplifikasi definisi tinggi), inpainting (perbaikan dan perluasan gambar) dan lineart (gambar garis), untuk lebih memperluas Matriks ControlNet-nya. Penambahan plug-in ini memungkinkan model Hunyuan DiT mencakup skenario aplikasi yang lebih luas, termasuk 80% kasus dan skenario seperti seni, kreativitas, arsitektur, fotografi, kecantikan, dan e-commerce, menyediakan perusahaan global dan pengembang individu dan pencipta dengan Memberikan pembuatan gambar yang lebih akurat dan kebebasan berkreasi yang lebih besar.
Plug-in Tile dapat memperluas informasi untuk gambar dan mencapai amplifikasi ultra-jernih, bahkan mencapai resolusi 4K hingga 8K, yang cocok untuk pemandangan yang memerlukan kesempurnaan gambar. Plug-in Inpainting dapat mengisi bagian gambar yang berlumuran dan berbintik-bintik sesuai dengan kebutuhan pembuatnya, mencapai efek seperti penggantian latar belakang dan perubahan subjek karakter, dan menangani menggambar ulang gambar di area yang luas. Plug-in Lineart menggunakan tipe garis berbeda untuk membuat gambar kehidupan nyata, animasi, dan arsitektur, serta cocok untuk menghasilkan rendering arsitektur dan mewarnai manuskrip.
Selain itu, Tencent Hunyuan DiT sebelumnya telah merilis model ControlNet dengan kecerdikan (tepi), kedalaman (kedalaman), pose (postur manusia) dan kondisi lain untuk mendukung pengembang dalam penalaran, dan telah menjadikan program pelatihan ControlNet sebagai sumber terbuka untuk memungkinkan pengembang dan pencipta untuk Kemampuan untuk melatih model ControlNet khusus.
Sejak mengumumkan peningkatan komprehensif dan sumber terbuka pada bulan Mei, Hunyuan DiT, sebagai model pembuatan grafik sumber terbuka arsitektur DiT asli Tiongkok pertama di industri, terus membangun ekosistem pengembang dan merilis perpustakaan akselerasi eksklusif untuk meningkatkan efisiensi penalaran dan mempersingkat pembuatan grafik waktu. Dan selanjutnya open source kode inferensi. Pada bulan Juli, Hunyuan DiT ditingkatkan ke versi 1.2, dan versi memori video kecil bersumber terbuka. Ini hanya memerlukan memori video 6G untuk dijalankan, membuatnya lebih ramah bagi pengembang yang diterapkan secara lokal di komputer pribadi.
Saat ini, Hunyuan DiT memiliki lebih dari 3,1 ribu bintang di Github, menjadikannya model open source DiT domestik paling populer.
Situs web resmi
https://dit.hunyuan.tencent.com/
kode
https://github.com/Tencent/HunyuanDiT
Model
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
kertas
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Secara keseluruhan, pembaruan berkelanjutan dan strategi sumber terbuka Tencent Hunyuan DiT memberi pengembang dan pencipta alat dan sumber daya yang kuat, serta mendorong kemajuan dan pengembangan teknologi Wenshengtu. Patut dinantikan lebih banyak inovasi dan terobosan di masa depan.