Hugging Face发布了名为aMUSEd的轻量级文本到图像生成模型,该模型基于Masked Image Model(MIM)架构,显着缩短了图像生成时间。 与传统的文本到图像模型相比,aMUSEd在速度和可解释性方面均有显着提升,其快速生成图像的能力令人印象深刻。目前aMUSEd模型以研究预览版形式在Hugging Face平台上提供,并采用OpenRAIL许可证,鼓励社区参与和贡献。
Hugging Face推出的aMUSEd模型可以在几秒钟内生成图像,采用了轻量级的文本到图像模型,使用Masked Image Model(MIM)架构,大大减少了推理步骤,提高了生成速度和可解释性。 aMUSEd模型可在Hugging Face上的演示中进行尝试,目前以研究预览版形式提供,使用OpenRAIL许可证,鼓励社区进一步探索非扩散框架用于图像生成。aMUSEd模型的快速生成能力和开放的许可证使其具有极大的发展潜力,未来有望在图像生成领域发挥更大的作用,也为人工智能技术发展提供了新的方向。 期待社区进一步探索并优化该模型。