Hugging Face telah merilis model pembuatan teks-ke-gambar ringan yang disebut aMUSEd, yang didasarkan pada arsitektur Masked Image Model (MIM) dan secara signifikan mengurangi waktu pembuatan gambar. Dibandingkan dengan model teks-ke-gambar tradisional, aMUSEd menawarkan peningkatan yang signifikan dalam kecepatan dan kemampuan interpretasi, dan kemampuannya untuk menghasilkan gambar dengan cepat sangat mengesankan. Model aMUSEd saat ini tersedia sebagai pratinjau penelitian di platform Hugging Face dan menggunakan lisensi OpenRAIL untuk mendorong partisipasi dan kontribusi komunitas.
Model aMUSEd yang diluncurkan oleh Hugging Face dapat menghasilkan gambar dalam beberapa detik. Model ini mengadopsi model teks-ke-gambar yang ringan dan menggunakan arsitektur Masked Image Model (MIM), yang sangat mengurangi langkah-langkah penalaran dan meningkatkan kecepatan pembuatan serta kemampuan interpretasi. Model aMUSEd dapat dicoba dalam demo di Hugging Face dan saat ini tersedia sebagai pratinjau penelitian di bawah lisensi OpenRAIL, di mana komunitas didorong untuk mengeksplorasi lebih jauh kerangka non-difusi untuk pembuatan gambar.Kemampuan generasi cepat dan lisensi terbuka model amUSEd memberikan potensi pengembangan yang besar. Model ini diharapkan dapat memainkan peran yang lebih besar dalam bidang pembuatan gambar di masa depan, dan juga memberikan arah baru bagi pengembangan teknologi kecerdasan buatan. Kami menantikan komunitas untuk mengeksplorasi dan mengoptimalkan model ini lebih lanjut.