個人可免費商用！ Stability AI發表Stable Diffusion3.5系列文生圖模型

作者：Eve Cole 更新時間：2024-12-09 17:32:01

Downcodes小編獲悉，Stability AI發布了其最新、最強大的圖像生成模型Stable Diffusion 3.5，該模型並非單一版本，而是包含三個版本，以滿足不同用戶的需求，從科研人員到企業用戶都能從中獲益。這三個版本在參數量、運行速度和適用硬體方面各有側重，為用戶提供了更廣泛的選擇。

昨日晚間，Stability AI發布了其最強大的模型——Stable Diffusion3.5，這不僅是一個單一的模型，而是一個包含三個版本的全家桶，旨在滿足從科研人員到業務愛好者、新創公司和企業的多樣化需求。

這三個版本分別是Stable Diffusion3.5Large、Stable Diffusion3.5Large Turbo和即將於10月29日發布的Stable Diffusion3.5Medium。

Stable Diffusion3.5Large是一個擁有80億參數的基礎模型，以其卓越的圖像品質和提示詞精確度而著稱，非常適合專業用途，能夠生成高達1百萬像素分辨率的圖像。

Stable Diffusion3.5Large Turbo是前者的蒸餾版本，它能夠在僅4步內生成高品質影像，生成速度遠快於Stable Diffusion3.5Large。

而Stable Diffusion3.5Medium則擁有25億參數，採用改良的MMDiT-X架構與訓練方法，設計為即插即用，能夠在消費級硬體上直接運行，平衡了影像品質與可自訂性，能夠產生分辨率在0.25到2百萬像素之間的影像。

這些模型的開發優先考慮了可自訂性，透過將Query-Key Normalization整合到transformer區塊中，穩定了模型訓練過程並簡化了進一步的微調和開發。為了支援下游任務的靈活性，Stability AI在模型中保留了更廣泛的知識基礎和多樣化的風格，儘管這可能導致輸出結果的不確定性增加。

Stable Diffusion3.5模型在多個方面表現出色，包括可自訂性、高效性能和多樣化輸出。這些模型能夠輕鬆微調以滿足特定創作需求，或根據客製化的工作流程建立應用程式。它們也經過最佳化，可在標準消費級硬體上運行，無需過高的硬體需求。此外，這些模型能夠創造代表全世界的圖像，無需大量的提示詞，同時能夠產生各種風格和美感的圖片，如3D、攝影、繪畫、線條藝術以及幾乎任何可以想像到的視覺風格。

Stability AI也強調了其對安全的承諾，採取了合理的措施防止Stable Diffusion3.5被濫用，並從開發早期階段就注重完整性。此外，Stability AI社群許可非常寬鬆，允許個人和組織免費使用該模型進行非商業用途，包括科學研究。對於年收入不超過100萬美元的新創公司、中小型企業和創作者，也可以免費將該模型用於商業用途。保留產生媒體的所有權，無需受到限制性許可的影響。

Stable Diffusion3.5模型已經在Hugging Face上可供自架使用，推理程式碼也已經開源。此外，還可以透過Stability AI API、Replicate、ComfyUI和DeepInfra等平台存取模型。

體驗網址: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

總而言之，Stable Diffusion 3.5系列模型在影像品質、生成速度和易用性方面取得了顯著進展，為使用者提供了強大的影像生成能力和靈活的應用場景。 Downcodes小編建議各位讀者前往體驗，感受其強大的表現。