Xinsir は、単一のネットワークを通じて 10 種類以上の条件制御を実現し、Openpose、Canny などの入力をサポートし、頻繁なモデル変更の煩わしさを回避する Controlnet++ オープン ソース モデルをリリースしました。 Downcodes のエディターが、Controlnet++ の機能と利点、およびテキストから画像への生成の分野への影響について詳しく説明します。
最近、Xinsir は、ネットワークを通じて 10 を超える状態を制御できる新しい Controlnet++ オープン ソース モデルをリリースしました。具体的には、Controlnet++ は Openpose や Canny などの入力をサポートしているため、モデルを頻繁に変更する手間を回避できます。
Controlnet++ は ControlNet アーキテクチャに基づいており、テキストから画像への生成と編集のための新しいモジュールを通じて 10 を超える異なるコントロール タイプをサポートします。このモデルは、Midjourney に匹敵するビジュアル品質の高解像度画像を生成できるため、細かい編集が必要なデザイナーにとって特に便利です。
モデル設計の特徴
複数のコントロール: Controlnet++ は、複数の画像条件の制御をサポートし、同じネットワーク パラメータを使用して異なる条件下で画像を生成できる新しいアーキテクチャを設計しました。
新しいモジュール: このモデルには 2 つの新しいモジュールが導入されています。1 つは、元の ControlNet を拡張してさまざまな画像条件をサポートするもので、もう 1 つは、計算負荷を増加させることなく複数条件の入力をサポートするものです。これは、画像を編集する必要があるデザイナーに非常に適しています。詳細に。
パフォーマンス テスト: SDXL での実験では、Controlnet++ が制御機能と美的スコアの点で元のモデルよりも優れていることが示されています。
Controlnet++ では、Openpose、Depth、Canny などの単一条件から、Openpose + Canny、Openpose + Depth などの複数条件の組み合わせ例まで、さまざまな制御条件での画像生成例を提供します。これらの例は、さまざまな条件下でのモデルの強力な生成機能を示しています。
現在、Controlnet++ は Web UI および Comfyui では利用できませんが、その多用途性と高品質な出力により、テキストから画像への生成における重要な進歩となります。デザイナーや開発者は、近い将来、より多くのプラットフォームがこの強力なモデルをサポートし、高品質の画像の生成と編集が容易になることが期待できます。
モデルのダウンロードアドレス:https://top.aibase.com/tool/controlnet-
Controlnet++ の効率性と多用途性により、画像生成の分野で大きな進歩があり、将来的には幅広い用途が期待されます。 Downcodes の編集者は、このモデルを統合するプラットフォームがさらに増え、ユーザーにより便利な画像作成体験を提供できることを期待しています。