Stability AIは、新しい無料の商用AI塗装ツールであるStable Diffusion 3.5 Mediumの発売を発表し、AI塗装技術の革新を再びリードしています。このモデルは、高性能と低いしきい値で、「誰もが使用できる」というビジョンを本当に実現し、高度なAI絵画能力を一般にもたらします。合理化された25億のパラメーター設計を採用しています。これには、スムーズに実行するには9.9GBのビデオメモリのみが必要です。通常のユーザーのハードウェアの制限を突破し、AI塗装のしきい値を大幅に削減します。
安定性AIは再び技術的な障壁を突破し、新しい安定した拡散3.5mediumモデルを起動します。このAIの絵画ツールは、完全に無料で商業用に開かれているだけでなく、さらに重要なことに、高性能と普及の完全なバランスをとることです。
マルチモーダル拡散コンバーター(MMDIT-X)アーキテクチャを採用するこのモデルは、25億パラメーターの合理化された設計を持ち、通常のユーザーのハードウェアしきい値の問題を巧みに解決します。わずか9.9GBのビデオメモリで、ほとんどの消費者グラフィックスカードでスムーズに実行でき、「誰もが使用できる」というビジョンを本当に実現できます。
技術革新の観点から、モデルは3つの事前に訓練されたテキストエンコーダーを統合し、QK標準化テクノロジーを導入してトレーニングの安定性を改善します。最初の12の変換層のデュアルな注意モジュール設計により、画質、レイアウト効果、複雑な迅速な理解の点でモデルが大幅に改善されたことに特に言及する価値があります。
モデルのトレーニングプロセスは、合成データと選択されたパブリックデータを組み合わせて、ハイブリッドトレーニング戦略を採用してプログレッシブ解像度の改善を採用し、生成された画像の多様性と品質を確保します。同様の中型モデルと比較して、画像生成効果と処理速度における明らかな利点があります。
ただし、ユーザーは使用中にいくつかの詳細に注意する必要があります。過度に長い単語は、画像の端で欠陥を引き起こす可能性があります同時に、トレーニングデータの分布の違いにより、同じ迅速な単語が異なる創造的効果を生み出す可能性があることに注意する必要があります。
このモデルのリリースは、個々のクリエイターとスタートアップに便利なAI作成ツールを提供するだけでなく、AIテクノロジーの普及を促進する安定性AIの決意を反映しています。芸術的な創造や教育開発に使用されるかどうかにかかわらず、AI作成の可能性をより広いユーザーベースにもたらします。
モデルのダウンロードアドレス:https://huggingface.co/stability/stable-diffusion-3.5-medium
安定した拡散3.5の出現は、AI絵画技術の段階をより人気があり、使いやすくなります。その無料の商業的性質と低いハードウェアの要件は、より多くの人々のためのAI芸術的創造への扉を開き、さまざまな分野でのAIテクノロジーのアプリケーションと開発を促進します。