Hugging Face는 MIM(Masked Image Model) 아키텍처를 기반으로 하고 이미지 생성 시간을 크게 줄이는 aMUSEd라는 경량 텍스트-이미지 생성 모델을 출시했습니다. 기존의 텍스트-이미지 모델과 비교하여 aMUSEd는 속도와 해석 가능성이 크게 향상되었으며 이미지를 빠르게 생성하는 능력이 인상적입니다. aMUSEd 모델은 현재 Hugging Face 플랫폼에서 연구 미리 보기로 제공되며 OpenRAIL 라이선스를 채택하여 커뮤니티 참여와 기여를 장려합니다.
Hugging Face가 출시한 aMUSEd 모델은 가벼운 텍스트-이미지 모델을 채택하고 MIM(Masked Image Model) 아키텍처를 사용하여 추론 단계를 크게 줄이고 생성 속도와 해석 가능성을 향상시키는 데 몇 초 만에 이미지를 생성할 수 있습니다. aMUSEd 모델은 Hugging Face의 데모에서 시험해 볼 수 있으며 현재 OpenRAIL 라이선스에 따라 연구 미리 보기로 제공됩니다. 여기서 커뮤니티는 이미지 생성을 위한 비확산 프레임워크를 추가로 탐색하도록 권장됩니다.aMUSEd 모델의 빠른 생성 능력과 오픈 라이선스는 앞으로 이미지 생성 분야에서 더 큰 역할을 할 것으로 기대되며, 인공지능 기술 발전에 새로운 방향을 제시하기도 합니다. 우리는 커뮤니티가 이 모델을 더욱 탐구하고 최적화할 수 있기를 기대합니다.