Stabilitas AI mengumumkan peluncuran medium difusi 3.5 stabil, alat lukisan AI komersial gratis baru, sekali lagi memimpin inovasi teknologi lukisan AI. Dengan kinerja tinggi dan ambang batas rendah, model ini membawa kemampuan melukis AI canggih kepada publik, benar -benar menyadari visi "semua orang dapat menggunakan". Ini mengadopsi desain parameter 2,5 miliar yang ramping, yang hanya membutuhkan 9.9GB memori video untuk berjalan dengan lancar, menembus keterbatasan perangkat keras pengguna biasa dan sangat mengurangi ambang batas untuk lukisan AI.
Stabilitas AI sekali lagi menerobos hambatan teknis dan meluncurkan model difusi stabil3.5Medium yang stabil. Alat melukis AI ini untuk publik tidak hanya sepenuhnya gratis dan terbuka untuk penggunaan komersial, tetapi yang lebih penting, ia mencapai keseimbangan yang sempurna antara kinerja tinggi dan popularisasi.
Model ini, yang mengadopsi arsitektur Multimodal Diffusion Converter (MMDIT-X), memiliki desain ramping 2,5 miliar parameter, secara cerdik memecahkan masalah ambang perangkat keras dari pengguna biasa. Dengan hanya 9.9GB memori video, itu dapat berjalan dengan lancar pada sebagian besar kartu grafis kelas konsumen, benar-benar menyadari visi "semua orang dapat digunakan".
Dalam hal inovasi teknologi, model ini mengintegrasikan tiga encoder teks pra-terlatih dan memperkenalkan teknologi standardisasi QK untuk meningkatkan stabilitas pelatihan. Perlu disebutkan bahwa desain modul perhatian ganda dalam 12 lapisan transformasi pertama telah secara signifikan meningkatkan model dalam hal kualitas gambar, efek tata letak dan pemahaman cepat yang kompleks.
Proses pelatihan model menggabungkan data sintetis dengan data publik yang dipilih, dan mengadopsi strategi pelatihan hibrida dengan peningkatan resolusi progresif, memastikan keragaman dan kualitas gambar yang dihasilkan. Dibandingkan dengan model berukuran sedang yang serupa, ini menunjukkan keunggulan yang jelas dalam efek pembuatan gambar dan kecepatan pemrosesan.
Namun, pengguna perlu memperhatikan beberapa detail selama penggunaan: kata -kata cepat yang sangat panjang dapat menyebabkan cacat di tepi gambar; Saat yang sama, harus dicatat bahwa karena perbedaan dalam distribusi data pelatihan, kata -kata cepat yang sama dapat menghasilkan efek kreatif yang berbeda.
Rilis model ini tidak hanya menyediakan alat penciptaan AI yang nyaman untuk pencipta dan start-up individu, tetapi juga mencerminkan tekad stabilitas AI untuk mempromosikan mempopulerkan teknologi AI. Apakah digunakan untuk penciptaan artistik atau pengembangan pendidikan, itu akan membawa kemungkinan penciptaan AI ke basis pengguna yang lebih luas.
Alamat unduhan model: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
Munculnya medium difusi stabil 3.5 menandai tahap teknologi lukisan AI menjadi lebih populer dan mudah digunakan. Sifat komersialnya gratis dan persyaratan perangkat keras yang rendah akan membuka pintu bagi penciptaan artistik AI untuk lebih banyak orang dan mempromosikan aplikasi dan pengembangan teknologi AI di berbagai bidang.