MMD-DDM
MMD 微調整によるノイズ除去拡散モデルの高速推論
ノイズ除去拡散モデル (DDM) は、複雑なデータ分布から高品質のサンプルを生成するための一般的なツールとなっています。これらのモデルは、データ内の洗練されたパターンと構造を捕捉することができ、非常に多様で基礎となる分布を代表するサンプルを生成できます。ただし、データ分布を忠実に捕捉するには多数の推論タイムステップが必要となるため、拡散モデルの主な制限の 1 つはサンプル生成の複雑さです。この論文では、拡散モデルの高速サンプリングのための新しい方法である MMD-DDM を紹介します。私たちのアプローチは、最大平均不一致 (MMD) を使用して、与えられたタイムステップの割り当てで学習された分布を微調整するという考えに基づいています。これにより、微調整されたモデルは、少数のステップで推論領域の忠実度を大幅に向上させることによって、または同等に、目標の忠実度に到達するために必要なステップ数を減らすことによって、速度と品質のトレードオフを大幅に改善することができ、これにより、より多くのステップを実現するための道が開かれます。拡散モデルを幅広い用途で実用化。
私たちが提案する MMD-DDM 戦略を使用して事前トレーニング済みの拡散モデルを微調整するには、事前トレーニング済みのモデルをダウンロードして、runners/diffusion.py でパスを調整するか、/function/ckpt_util.py にあるモデルを使用して次のコマンドを実行します。
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --exp {PROJECT_PATH} --train
微調整されたモデルから生成されたサンプル画像を取得するには、新しくトレーニングされたモデルを使用して、runners/diffusion.py の test_FID 関数のパスを調整し、実行します。
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --test_FID
MMD-DDM が研究に役立つと思われる場合は、次の引用を検討してください。
@article { aiello2023fast ,
title = { Fast Inference in Denoising Diffusion Models via MMD Finetuning } ,
author = { Aiello, Emanuele and Valsesia, Diego and Magli, Enrico } ,
journal = { arXiv preprint arXiv:2301.07969 } ,
year = { 2023 }
}
このリポジトリは DDIM 公式実装に基づいています: https://github.com/ermongroup/ddim
ご質問がございましたら、お気軽に問題をオープンするか、[email protected] までお問い合わせください。
? ⛏️ ?
事前トレーニング済みモデルは近日リリースされます。