Downcodes の編集者は、Stability AI がテキストから画像への生成モデルである Stable Diffusion 3.5 を最近リリースしたことを知りました。これには、Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo、Stable Diffusion 3.5 Medium の 3 つのバージョンが含まれており、ユーザーのニーズを満たすように設計されています。プロフェッショナルからカジュアルな愛好家まで、さまざまなユーザーが利用できます。このアップデートは、以前のバージョンの欠点に対する Stability AI の対応であり、競争力を向上させ、OpenAI の DALL-E や Midjourney などのプラットフォームと競合することを目的としています。新しいモデルでは、画質、生成速度、使いやすさが大幅に向上しており、モデルのカスタマイズ性とプロンプトへの応答性を強化するクエリキー正規化テクノロジが導入されています。
Stability AI は最近、最新の深層学習テキストから画像への生成モデルである Stable Diffusion3.5 を発表しました。このリリースには、研究者、企業顧客、愛好家など、さまざまなユーザーのニーズを満たすように設計された 3 つの改良されたオープンソース モデルが含まれています。
中でもStable Diffusion3.5Largeはシリーズ全体で最も強力なモデルで、パラメータ数は81億にも及びます。このモデルは、優れた画質とプロンプトへの高い応答性を備え、最大 1 メガピクセルの解像度で高品質の画像を生成できるため、プロのユーザーに最適です。
なお、Stable Diffusion3.5Large Turboは、Stable Diffusion3.5Largeの簡易版です。高画質な画像を生成する速度が大幅に向上し、わずか 4 ステップで画像生成が完了するため、迅速に作成する必要があるユーザーに適しています。
もう 1 つの新しいモデルは Stable Difffusion3.5Medium で、これには 25 億のパラメータがあります。このモデルは、改良された MMDiT-X アーキテクチャとトレーニング方法を使用しており、「箱から出してすぐに」使用でき、消費者グレードのハードウェアでもスムーズに実行できるように設計されています。画像生成の品質とカスタマイズの容易さの間でバランスが取れており、0.25 ~ 2 メガピクセルの画像を生成します。
このリリースの背景には、6 月にリリースされた Stable Diffusion3Medium が期待に応えられなかったことを受けて、Stability AI がより革新的なソリューションをリリースすることを決定したことが挙げられます。同社は、OpenAIのDALL-EやMidjourneyなどのプラットフォームからの課題に対処するため、今回のアップデートで市場競争力を取り戻したいと述べた。
新しいモデルの重要な技術革新は、クエリキー正規化テクノロジの導入です。この革新により、モデルのカスタマイズとプロンプトへの応答性が強化され、ユーザーは明示的なプロンプトでより一貫した結果を達成できるほか、より広範なプロンプトを使用する場合にはより豊富な画像解釈が可能になります。
Stable Diffusion3.5 シリーズのモデルは、Stability AI のコミュニティ ライセンスに基づいてリリースされ、ユーザーは非営利目的で無料で使用できます。同時に、年間収益が 100 万米ドル未満の企業も無料で使用できますが、この収益を超えるユーザーはエンタープライズ ライセンスを申請する必要があります。
セルフホスティングに必要なすべてのモデルとそのウェイトは、Hugging Face および Stability AI の API で利用可能になります。さらに、高度な画像カスタマイズ オプションを提供する ControlNets 機能が数日以内にリリースされる予定です。
正式な入り口:
https://stability.ai/stable-image
ハグフェイス入口の 3 つのバージョン:
https://huggingface.co/stabilityai/stable-diffusion-3.5-large
https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo
https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
全体として、Stable Diffusion 3.5 シリーズの発売は、テキストから画像への生成テクノロジーにおける重要な進歩を示し、ユーザーにより多くの選択肢とより強力な機能を提供します。 Downcodes の編集者は、将来的により革新的な機能が登場することを楽しみにしています。