Stabilitas AI mengumumkan peluncuran stabil difusi 3.5, serangkaian tiga versi berbeda dari model pembuatan teks-ke-gambar besar. Seri ini bertujuan untuk memenuhi berbagai kebutuhan dari para peneliti hingga pelanggan perusahaan hingga penggemar, dengan memberikan model skala parameter yang berbeda dan karakteristik kinerja yang sesuai dengan kemampuan komputasi dan skenario aplikasi yang berbeda. Pembaruan ini dimaksudkan untuk menanggapi kekurangan sebelumnya dari difusi 3.0 yang stabil dan bersaing dengan alat pembuatan gambar AI terkemuka lainnya di pasaran.
Stability AI baru-baru ini meluncurkan model pembuatan teks-ke-gambar pembelajaran terakhirnya-difusi stabil3.5. Rilis ini mencakup tiga model open source yang ditingkatkan yang dirancang untuk memenuhi kebutuhan pengguna yang berbeda, termasuk peneliti, pelanggan perusahaan, dan penggemar.
Di antara mereka, difusi yang stabil3.5 -Large adalah model yang paling kuat di seluruh seri, dengan parameter setinggi 8,1 miliar. Dengan kualitas gambarnya yang sangat baik dan responsif tinggi terhadap petunjuk, model ini ideal untuk pengguna profesional, yang mampu menghasilkan gambar berkualitas tinggi dengan resolusi hingga 1 megapiksel.
Selain itu, difusi stabil3.5large turbo adalah versi sederhana dari difusi stabil3.5large. Saat menghasilkan gambar berkualitas tinggi, itu sangat meningkatkan kecepatan.
Model baru lainnya adalah difusi stabil3.5Medium, yang memiliki 2,5 miliar parameter. Model ini mengadopsi arsitektur MMDIT-X yang ditingkatkan dan metode pelatihan, yang dirancang untuk menjadi "di luar kotak" dan berjalan dengan lancar bahkan pada perangkat keras konsumen. Ini mencapai keseimbangan yang baik antara kualitas pembuatan gambar dan kemudahan kustomisasi, menghasilkan gambar 0,25 hingga 2 megapiksel.
Latar belakang rilis ini adalah bahwa setelah rilis Juni dari Difusion3Medium gagal memenuhi harapan, stabilitas AI memutuskan untuk meluncurkan solusi yang lebih transformatif. Perusahaan mengatakan mereka berharap dapat mendapatkan kembali daya saing pasar dengan pembaruan untuk memenuhi tantangan dari platform seperti Openai's Dall-E dan Midjourney.
Inovasi teknologi penting dalam model baru ini adalah pengenalan teknologi normalisasi kunci kueri. Inovasi ini meningkatkan kustomisasi model dan responsif terhadap petunjuk, dan pengguna dapat memperoleh hasil yang lebih konsisten dengan petunjuk yang jelas, sementara juga mendapatkan interpretasi gambar yang lebih kaya saat menggunakan petunjuk yang lebih luas.
Model seri Difusion3.5 yang stabil akan dirilis di bawah lisensi komunitas AI Stabilitas, yang memungkinkan pengguna untuk menggunakan non-komersial secara gratis. Pada saat yang sama, entitas dengan pendapatan tahunan kurang dari US $ 1 juta juga dapat digunakan untuk penggunaan komersial secara gratis, sementara pengguna dengan pendapatan berlebih harus berlaku untuk lisensi perusahaan.
Semua model dan bobot self-hosting mereka disediakan pada wajah pemeluk dan stabilitas API AI. Selain itu, fitur ControlNets, yang menawarkan opsi kustomisasi gambar canggih, diharapkan akan diluncurkan dalam beberapa hari mendatang.
Pintu masuk resmi:
https://stability.ai/stable-image
Tiga versi portal wajah pelukan:
https://huggingface.co/stabilityai/stable-diffusion-3.5-large
https://huggingface.co/stabilityai/stable-diffusion-3.5-large-urbo
https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
Poin -Poin Kunci:
Difusi stabil yang baru diluncurkan3.5 menawarkan tiga versi model untuk memenuhi kebutuhan pengguna yang berbeda.
Difusi stabil3.5 BLARGE Turbo memiliki kecepatan pembuatan gambar yang lebih cepat, cocok untuk pembuatan cepat.
Model baru ini memperkenalkan teknologi normalisasi kunci-kueri, yang meningkatkan kustomisasi dan responsif.
Singkatnya, peluncuran model seri difusi 3.5 yang stabil menandai peningkatan besar stabilitas AI di bidang pembuatan teks-ke-gambar. dalam persaingan pasar yang sengit. Kunjungi tautan yang disediakan dan alami teknologi pembuatan gambar baru!