Model difusi adalah penggunaan pembelajaran mendalam yang menarik untuk mensimulasikan evolusi data bertahap dari waktu ke waktu. Konsep di balik pembangkitan menggunakan model difusi adalah mengubah titik data secara iteratif dari noise menjadi distribusi target yang merupakan distribusi data asli. Transformasi ini dilakukan melalui serangkaian langkah terpisah. Tahap pelatihan meliputi difusi maju dan difusi mundur.
Dalam proses difusi maju, kami secara bertahap menambahkan derau gaussian ke data untuk sejumlah langkah waktu acak 't' ('t' kurang dari atau sama dengan jumlah total langkah waktu yang telah ditentukan) sehingga menghasilkan gambar bersuara. Dalam proses difusi terbalik, kami memulai dengan gambar yang diberi noise (diberi noise untuk langkah 't' dalam difusi maju) dan kami melatih model UNet, yang membantu menurunkan tingkat noise dengan memprediksi noise yang ditambahkan ke gambar asli.
Untuk menghasilkan gambar baru, kami cukup melakukan difusi terbalik secara iteratif. Untuk melakukan hal ini, pertama-tama kami mengambil sampel derau dari gaussian standar dan kami memprediksi serta menghilangkan derau tersebut secara bertahap selama jumlah langkah waktu yang telah ditentukan sehingga menghasilkan gambar yang menyerupai distribusi data asli.