MMD-DDM
MMD 미세 조정을 통한 노이즈 제거 확산 모델의 빠른 추론
DDM(Denoising Diffusion Model)은 복잡한 데이터 분포에서 고품질 샘플을 생성하는 데 널리 사용되는 도구가 되었습니다. 이러한 모델은 데이터의 정교한 패턴과 구조를 포착할 수 있으며 매우 다양하고 기본 분포를 대표하는 샘플을 생성할 수 있습니다. 그러나 확산 모델의 주요 제한 사항 중 하나는 샘플 생성의 복잡성입니다. 데이터 분포를 충실하게 캡처하려면 많은 추론 시간 단계가 필요하기 때문입니다. 본 논문에서는 확산 모델의 빠른 샘플링을 위한 새로운 방법인 MMD-DDM을 제시합니다. 우리의 접근 방식은 주어진 시간 단계 예산으로 학습된 분포를 미세 조정하기 위해 최대 평균 불일치(MMD)를 사용한다는 아이디어를 기반으로 합니다. 이를 통해 미세 조정된 모델은 몇 단계만으로 추론 체제의 충실도를 실질적으로 높이거나 동등하게 목표 충실도에 도달하는 데 필요한 단계 수를 줄여 속도-품질 균형을 크게 향상시킬 수 있습니다. 광범위한 응용 분야에서 확산 모델을 실제로 채택합니다.
제안된 MMD-DDM 전략을 사용하여 사전 훈련된 확산 모델을 미세 조정하려면 사전 훈련된 모델을 다운로드하고runners/diffusion.py에서 경로를 조정하거나 /function/ckpt_util.py에 있는 모델을 사용하고 다음 명령을 실행합니다.
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --exp {PROJECT_PATH} --train
미세 조정된 모델에서 생성된 이미지를 샘플링하려면 새로 훈련된 모델을 사용하여 runners/diffusion.py의 test_FID 함수에서 경로를 조정하고 다음을 실행합니다.
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --test_FID
MMD-DDM이 귀하의 연구에 도움이 되었다고 생각되면 다음을 인용해 보십시오.
@article { aiello2023fast ,
title = { Fast Inference in Denoising Diffusion Models via MMD Finetuning } ,
author = { Aiello, Emanuele and Valsesia, Diego and Magli, Enrico } ,
journal = { arXiv preprint arXiv:2301.07969 } ,
year = { 2023 }
}
이 저장소는 DDIM 공식 구현을 기반으로 합니다: https://github.com/ermongroup/ddim
질문이 있는 경우 언제든지 이슈를 공개하거나 [email protected]로 문의해 주세요.
? ⛏️ ?
사전 훈련된 모델이 곧 출시될 예정입니다!