Stability AIは、大規模なテキストから画像の生成モデルの3つの異なるバージョンの一連のバージョンであるStable Diffusion 3.5の発売を発表します。このシリーズは、さまざまなパラメータースケールとパフォーマンス特性のモデルを提供して、さまざまなコンピューティング機能とアプリケーションシナリオに合わせて、さまざまなパラメータースケールとパフォーマンス特性のモデルを提供することにより、研究者から企業の顧客、愛好家まで、幅広いニーズを満たすことを目的としています。この更新は、安定した拡散3.0の以前の欠点に応答し、市場で他の主要なAI画像生成ツールと競合することを目的としています。
Stability AIは最近、最新の深い学習テキストからイメージからイメージまでの生成モデルである安定した拡散モデル3.5を立ち上げました。このリリースには、研究者、企業の顧客、愛好家など、さまざまなユーザーのニーズを満たすように設計された3つの改良されたオープンソースモデルが含まれています。
その中で、安定した拡散3.5largeは、シリーズ全体で最も強力なモデルであり、パラメーターは81億個です。優れた画質とプロンプトに対する高い応答性により、このモデルはプロのユーザーに最適であり、最大1メガピクセルの解像度で高品質の画像を生成できます。
さらに、安定した拡散3.5largeターボは、安定した拡散3.5largeの単純化されたバージョンです。高品質の画像を生成すると、速度が大幅に向上します。
別の新しいモデルは、安定した拡散3.5メディウムです。これには25億パラメーターがあります。このモデルは、「ボックスから外れた」ように設計された改善されたMMDIT-Xアーキテクチャおよびトレーニング方法を採用し、消費者ハードウェアでもスムーズに実行します。画像生成の品質とカスタマイズの容易さのバランスを取り、0.25〜2メガピクセルの画像を生成します。
このリリースの背景は、安定した拡散3mediumの6月にリリースされた後、期待を満たすことができなかったため、安定性AIがより変革的なソリューションを開始することを決定したことです。同社は、OpenaiのDall-EやMidjourneyなどのプラットフォームからの課題を満たすために、アップデートで市場の競争力を取り戻すことを望んでいると述べました。
新しいモデルの重要な技術革新は、クエリキー正規化テクノロジーの導入です。このイノベーションは、モデルのカスタマイズとプロンプトへの応答性を高め、ユーザーは明確なプロンプトでより一貫した結果を得ることができ、より幅広いプロンプトを使用すると、より豊かな画像解釈を取得できます。
安定した拡散3.5シリーズモデルは、安定性AIのコミュニティライセンスの下でリリースされ、ユーザーは非営利的に無料で使用できます。同時に、年間収入が100万米ドル未満のエンティティは、商業用に無料で使用するために使用することもできますが、ユーザーは企業ライセンスを申請する必要があります。
すべてのモデルとその自己ホストウェイトは、抱きしめる顔と安定性AIのAPIに提供されます。さらに、高度な画像のカスタマイズオプションを提供するControlNets機能は、今後数日で起動する予定です。
公式の入り口:
https://stability.ai/stable-image
ハグのフェイスポータルの3つのバージョン:
https://huggingface.co/stability/stable-diffusion-3.5-large
https://huggingface.co/stability/stable-diffusion-3.5-large-turbo
https://huggingface.co/stability/stable-diffusion-3.5-medium
キーポイント:
新しく発売された安定した拡散3.5は、さまざまなユーザーニーズを満たすために3つのモデルバージョンを提供します。
安定した拡散3.5largeターボの画像生成速度は高速で、迅速な作成に適しています。
新しいモデルは、カスタマイズと応答性を向上させるクエリキー正規化テクノロジーを導入します。
要するに、安定した拡散3.5シリーズモデルの発売は、テキストからイメージの生成の分野における安定性AIの主要なアップグレードを示しています。激しい市場競争において。 提供されたリンクにアクセスして、真新しい画像生成テクノロジーを体験してください!