(Draf, WIP, Perkiraan tanggal publikasi: akhir tahun 2025 )
Buku teks ini dibuat dengan ahli untuk mahasiswa pascasarjana di bidang fisika dan ilmu komputer, menawarkan eksplorasi menyeluruh Denoising Diffusion Probabilistic Models (DDPMs) selama satu semester dalam bidang AI generatif yang luas. Tidak seperti teks konvensional yang mengikuti format definisi-teorema yang kaku, buku ini mengadopsi nada yang lebih santai dan percakapan , menggabungkan komentar ekstensif, motivasi, dan penjelasan untuk meningkatkan pemahaman dan keterlibatan.
Sampai saat ini, model difusi merupakan bidang yang hanya diketahui oleh sekelompok ilmuwan dan insinyur terpilih . AI Generatif, bidang yang sangat bergantung pada model ini, memerlukan pemahaman mendalam tentang matematika, fisika, proses stokastik, pembelajaran mendalam, dan ilmu komputer.
Buku ini mempelajari secara mendalam model difusi dalam AI Generatif, khususnya dengan fokus pada Denoising Diffusion Probabilistic Models (DDPMs) . Meskipun model generatif lainnya seperti Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), dan model berbasis aliran telah memajukan pembuatan sampel berkualitas tinggi, masing-masing model tersebut memiliki kelemahan yang signifikan. GAN dapat mengalami pelatihan yang tidak stabil dan keragaman keluaran yang terbatas; VAE bergantung pada fungsi kerugian pengganti yang kompleks, sehingga mempersulit pengoptimalan; dan model aliran memerlukan arsitektur khusus dan dapat dibalik.
Model difusi, yang mengambil inspirasi dari termodinamika non-ekuilibrium, menghadirkan alternatif yang kuat dengan mengatasi tantangan ini secara efektif. Buku ini menonjol karena hanya berkonsentrasi pada model difusi, menawarkan perspektif unik yang jarang ditemukan dalam teks lain. Pendekatan terfokus ini tidak hanya menyederhanakan ide-ide kompleks untuk khalayak yang lebih luas, namun juga mendorong batas-batas pencapaian AI dalam industri dan penelitian modern. Oleh karena itu, buku ini merupakan sumber daya penting bagi siapa pun yang ingin memahami dampak proses kreatif berbasis teknologi pada AI Generatif saat ini dan di masa depan.
Buku ini dimulai dengan konsep dasar, seperti pengenalan gerak Brown—bentuk difusi paling sederhana—dan secara bertahap berlanjut ke persamaan difusi yang lebih kompleks. Pendekatan terstruktur ini memastikan bahwa pembaca mengembangkan pemahaman mendalam tentang proses difusi maju dan mundur, memberikan landasan yang kuat untuk studi dan aplikasi tingkat lanjut.
Buku ini menawarkan eksplorasi rinci tentang konsep-konsep utama termasuk gerak Brown, lemma Itô, Persamaan Diferensial Stokastik (SDE), dan peran penting proses stokastik dalam kecerdasan buatan. Bab ini memberikan pengenalan menyeluruh tentang proses difusi, pemeriksaan DDPM yang cermat, dan bab yang didedikasikan untuk arsitektur pembelajaran mendalam yang mendasar bagi DDPM. Narasinya diperkaya dengan sejumlah besar permasalahan yang telah dipecahkan dan sejumlah proyek kecil pemrograman , yang berkonsentrasi terutama pada hasil-hasil yang memiliki relevansi substansial untuk implementasi praktis. Sebagai buku teks dan referensi tingkat pascasarjana yang ekstensif, buku ini menganut filosofi bahwa cara paling efektif untuk mempelajari DDPM adalah melalui penerapannya, diilustrasikan melalui contoh-contoh ekstensif yang mendemonstrasikan teori tersebut dalam skenario dunia nyata.
Setiap bab buku ini mengintegrasikan wacana teoretis dengan aplikasi praktis, yang berpuncak pada proyek pemrograman mini menggunakan Python . Proyek-proyek ini memungkinkan pembaca untuk mensimulasikan konsep-konsep teoretis dasar, seperti jalan acak atau gerakan Brown, dan maju ke implementasi yang lebih canggih, seperti mengembangkan DDPM. Pendekatan praktis ini tidak hanya memantapkan pembelajaran melalui keterlibatan aktif namun juga membekali siswa dan profesional dengan keterampilan untuk menerapkan model-model canggih ini secara efektif dalam berbagai konteks dunia nyata.
Selain itu, teks ini secara metodis mencakup topik-topik seperti Persamaan Diferensial Stochastic (SDEs), Gerak Brown, martingales, dan lemma Itô. Topik-topik ini saling terkait dalam konteks model difusi, sehingga mendorong pembaca untuk meninjau kembali diskusi sebelumnya untuk memahami sepenuhnya keterkaitan yang kompleks di antara konsep-konsep ini. Untuk memastikan kejelasan dan aksesibilitas, teks ini sengaja menghilangkan beberapa topik yang lebih bersifat esoteris, alih-alih berfokus pada penyediaan pengetahuan dasar dan wawasan mendalam yang penting untuk pemahaman menyeluruh tentang DDPM.
Kaya dengan beragam contoh dan latihan yang diselesaikan sepenuhnya dengan kompleksitas yang berbeda-beda, naskah ini mengintegrasikannya ke dalam narasi untuk meningkatkan dan menilai pemahaman pembaca secara luas. Latihan-latihan ini merupakan inti dari struktur buku ini , yang sering dijadikan referensi dalam diskusi berikutnya untuk mendorong lingkungan belajar yang dinamis dan interaktif.
Terinspirasi oleh seri Garis Besar Schaum yang terkenal , teks ini memadukan eksposisi teoretis yang ketat dengan penerapan praktis. Metodologi ini dibuat untuk memperkuat pengetahuan teoritis melalui pemecahan masalah secara langsung , sehingga meningkatkan pemahaman.
Meskipun fokus utamanya adalah teori, teks ini terkadang menyertakan cuplikan kode untuk menjembatani kesenjangan antara teori dan penerapan praktis, sehingga ideal bagi mahasiswa pascasarjana dan profesional yang berkomitmen untuk menguasai model difusi.
Setiap bagian dari setiap bab disusun untuk mencakup:
Untuk meningkatkan nilai pedagogi setiap bab dan memantapkan konsep teoritis yang disajikan, teks ini diakhiri dengan serangkaian proyek pemrograman praktis. Proyek-proyek ini dirancang untuk menjembatani kesenjangan antara teori dan praktik, memungkinkan pembaca untuk menerapkan pengetahuan baru mereka dalam lingkungan simulasi. Pendekatan praktis ini tidak hanya memperkuat pemahaman tetapi juga mempertajam keterampilan praktis yang penting untuk kemajuan di bidang AI generatif.
Proyek-proyek tersebut meliputi:
Proyek-proyek ini mendorong pemahaman mendalam tentang aspek praktis dari proses stokastik dan model difusi, mempersiapkan pembaca untuk mengatasi masalah dunia nyata dan berinovasi dalam domain AI generatif.