أصدرت Hugging Face نموذجًا خفيف الوزن لتحويل النص إلى صورة يسمى aMUSEd، والذي يعتمد على بنية نموذج الصورة المقنعة (MIM) ويقلل بشكل كبير من وقت إنشاء الصورة. بالمقارنة مع نماذج تحويل النص إلى صورة التقليدية، يقدم برنامج aMUSEd تحسينات كبيرة في السرعة وقابلية التفسير، وقدرته على إنشاء الصور بسرعة مثيرة للإعجاب. يتوفر نموذج aMUSEd حاليًا كمعاينة بحثية على منصة Hugging Face ويعتمد ترخيص OpenRAIL لتشجيع المشاركة والمساهمات المجتمعية.
يمكن للنموذج الممتع الذي أطلقته Hugging Face إنشاء صور في بضع ثوانٍ، وهو يعتمد نموذجًا خفيف الوزن لتحويل النص إلى صورة ويستخدم بنية نموذج الصورة المقنعة (MIM)، مما يقلل بشكل كبير من خطوات التفكير ويحسن سرعة التوليد وقابلية التفسير. يمكن تجربة نموذج aMUSEd في عرض توضيحي على Hugging Face وهو متاح حاليًا كمعاينة بحثية بموجب ترخيص OpenRAIL، حيث يتم تشجيع المجتمع على مواصلة استكشاف إطار عدم الانتشار لتوليد الصور.إن قدرة التوليد السريع لنموذج aMUSEd والترخيص المفتوح يمنحه إمكانات تطوير كبيرة، ومن المتوقع أن يلعب دورًا أكبر في مجال توليد الصور في المستقبل، كما يوفر اتجاهًا جديدًا لتطوير تكنولوجيا الذكاء الاصطناعي. ونحن نتطلع إلى أن يقوم المجتمع بمزيد من استكشاف هذا النموذج وتحسينه.