(草案,WIP,預計發售日期: 2025 年底)
這本教科書是為物理學和計算機科學專業的研究生精心編寫的,提供了一個為期一個學期的對生成人工智能廣闊領域內的去噪擴散概率模型 (DDPM) 的徹底探索。與遵循嚴格的定義定理證明格式的傳統文本不同,本書採用更輕鬆和對話的語氣,融入廣泛的評論、動機和解釋,以增強理解和參與。
直到最近,擴散模型還是只有少數科學家和工程師知道的小眾領域。生成人工智慧是一個嚴重依賴這些模型的領域,需要對數學、物理、隨機過程、深度學習和電腦科學有複雜的理解。
本書深入研究了產生人工智慧中的擴散模型,特別關注去噪擴散機率模型(DDPM) 。雖然生成對抗網路 (GAN)、變分自動編碼器 (VAE) 和基於流的模型等其他生成模型已經促進了高品質樣本的生成,但它們都有顯著的缺點。 GAN 可能會經歷不穩定的訓練和有限的輸出多樣性; VAE 依賴複雜的替代損失函數,使最佳化變得複雜;和流模型需要專門的、可逆的架構。
擴散模型從非平衡熱力學中汲取靈感,透過有效解決這些挑戰提供了強大的替代方案。本書的突出之處在於僅關注擴散模型,提供了其他文本中很少見的獨特視角。這種專注的方法不僅為更廣泛的受眾簡化了複雜的想法,而且還突破了人工智慧在現代工業和研究中所能實現的界限。因此,對於任何想要了解生成人工智慧中技術驅動的創意過程當前和未來影響的人來說,本書都是必不可少的資源。
本書從基本概念開始,例如介紹布朗運動(最簡單的擴散形式),然後逐漸深入更複雜的擴散方程式。這種結構化方法確保讀者對前向和後向擴散過程有深刻的理解,為高階研究和應用提供堅實的基礎。
本書詳細探討了關鍵概念,包括布朗運動、伊藤引理、隨機微分方程 (SDE) 以及隨機過程在人工智慧中的重要角色。它對擴散過程進行了詳盡的介紹,對 DDPM 進行了細緻的檢查,並有一章專門介紹了 DDPM 的基礎深度學習架構。敘述內容豐富,包含大量已解決的問題和大量的程式設計小型項目,主要集中在與實際實現具有重大相關性的結果。作為一本內容廣泛的研究生水平教科書和參考書,它秉承這樣的理念:了解 DDPM 最有效的方法是透過其應用,並透過在現實場景中展示該理論的大量示例進行說明。
本書的每一章都將理論論述與實際應用結合,最終以使用Python的迷你程式設計專案告終。這些項目允許讀者模擬基本的理論概念,例如隨機遊走或布朗運動,並進一步實現更複雜的實現,例如開發 DDPM。這種實踐方法不僅透過積極參與鞏固學習,而且還為學生和專業人士提供了在各種現實環境中有效部署這些先進模型的技能。
此外,本書系統性地涵蓋了隨機微分方程 (SDE)、布朗運動、鞅和伊藤引理等主題。這些主題在擴散模型的背景下相互關聯,鼓勵讀者重新審視先前的討論,以充分掌握這些概念之間複雜的相互關係。為了確保清晰度和可理解性,文本有意省略了一些更深奧的主題,而是專注於提供對於徹底理解 DDPM 至關重要的基礎知識和深刻見解。
這份手稿富含大量完全解決的範例和不同複雜程度的練習,將它們整合到敘述中,以廣泛地增強和評估讀者的理解。這些練習是本書結構的核心,在隨後的討論中經常被引用,以鼓勵動態和互動的學習環境。
受著名的 Schaum 的大綱系列的啟發,本書將嚴謹的理論闡述與實際應用結合起來。這種方法旨在透過實踐解決問題來強化理論知識,從而增強理解力。
雖然主要重點是理論,但本書偶爾會包含程式碼片段,以彌合理論與實際應用之間的差距,使其成為致力於掌握擴散模型的研究生和專業人士的理想選擇。
每章的每個部分的組織內容包括:
為了提高每一章的教學價值並鞏固所提出的理論概念,本書以一系列實用的程式設計專案作為結尾。這些項目旨在彌合理論與實踐之間的差距,使讀者能夠在模擬環境中應用新獲得的知識。這種實踐方法不僅可以增強理解,還可以提高在生成人工智慧領域取得進步所需的實用技能。
這些項目包括:
這些計畫鼓勵深入研究隨機過程和擴散模型的實際方面,幫助讀者解決現實世界的問題並在生成人工智慧領域進行創新。