Tencent の Hunyuan DiT ラージ モデル (HunyuanDiT) は継続的に更新され、より強力な画像生成機能をユーザーに提供します。 Downcodes の編集者は、HunyuanDiT とコミュニティが最近、モデルのパフォーマンスを大幅に向上させる 3 つの新しい制御可能なプラグイン ControlNet をリリースしたことを知りました。つまり、タイル (高精細度増幅)、インペイント (画像の修復と拡大)、およびリアート (線描画) です。 . 応用範囲と創造性の自由。これらのプラグインの追加により、Hunyuan DiT はアート、クリエイティブ、建築などの分野でより強力な応用可能性を発揮し、より正確で便利な画像生成サービスを世界中の開発者やクリエイターに提供できるようになります。
Tencent の HunyuanDiT 大型モデル (HunyuanDiT) は最近、コミュニティと協力して 3 つの新しい制御可能なプラグイン ControlNet、つまりタイル (高解像度の増幅)、インペインティング (画像の修復と拡張)、およびラインアート (線描画) をリリースし、さらに拡張しました。その ControlNet マトリックス。これらのプラグインの追加により、Hunyuan DiT モデルは、アート、創造性、建築、写真、美容、電子商取引などのケースやシナリオの 80% を含む、より幅広いアプリケーション シナリオをカバーできるようになり、グローバル企業や個人開発者に提供できるようになります。より正確な画像生成とより大きな創造的自由を提供します。
Tile プラグインは、映像の情報を拡張し、4K ~ 8K 解像度に達する超クリアな増幅を実現するため、映像のディテールを究極に追求する必要があるシーンに適しています。 Inpainting プラグインは、作成者のニーズに応じて画像の汚れやまだらな部分を塗りつぶし、背景の置換やキャラクターの被写体の変更などの効果を実現し、大面積の画像の再描画を処理できます。 Lineart プラグインは、さまざまな線種を使用して現実、アニメーション、建築の写真を作成し、建築のレンダリングや着色原稿の生成に適しています。
さらに、Tencent Hunyuan DiT は、開発者の推論をサポートするために、キャニー (エッジ)、デプス (奥行き)、ポーズ (人間の姿勢) などの条件を備えた ControlNet モデルを以前にリリースしており、開発者とクリエイターがカスタム ControlNet モデルをトレーニングする機能。
5月に包括的なアップグレードとオープンソースを発表して以来、Hunyuan DiTは、業界初の中国ネイティブのDiTアーキテクチャのオープンソースグラフ生成モデルとして、開発者エコシステムの構築を継続し、推論効率を向上させ、グラフ生成を短縮するための専用アクセラレーションライブラリをリリースしてきました。さらに推論コードをオープンソース化しました。 7 月には、Hunyuan DiT がバージョン 1.2 にアップグレードされ、ビデオ メモリの小さいバージョンがオープンソース化されました。これにより、実行に必要なビデオ メモリは 6G のみとなり、パーソナル コンピュータにローカルに展開する開発者にとってより使いやすくなりました。
現在、Hunyuan DiT は Github 上で 310,000 個以上のスターを獲得しており、国内で最も人気のある DiT オープンソース モデルとなっています。
公式サイト
https://dit.hunyuan.tencent.com/
コード
https://github.com/Tencent/HunyuanDiT
モデル
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
紙
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
全体として、Tencent Hunyuan DiT の継続的なアップデートとオープンソース戦略は、開発者とクリエイターに強力なツールとリソースを提供し、Wenshengtu テクノロジーの進歩と発展を促進し、将来のさらなる革新と画期的な進歩に期待する価値があります。