(草案,WIP,预计发布日期: 2025 年底)
这本教科书是为物理学和计算机科学专业的研究生精心编写的,提供了一个为期一个学期的对生成人工智能广阔领域内的去噪扩散概率模型 (DDPM) 的彻底探索。与遵循严格的定义定理证明格式的传统文本不同,本书采用更加轻松和对话的语气,融入广泛的评论、动机和解释,以增强理解和参与。
直到最近,扩散模型还是只有少数科学家和工程师知道的小众领域。生成人工智能是一个严重依赖这些模型的领域,需要对数学、物理、随机过程、深度学习和计算机科学有复杂的理解。
本书深入研究了生成人工智能中的扩散模型,特别关注去噪扩散概率模型(DDPM) 。虽然生成对抗网络 (GAN)、变分自动编码器 (VAE) 和基于流的模型等其他生成模型已经促进了高质量样本的生成,但它们都有显着的缺点。 GAN 可能会经历不稳定的训练和有限的输出多样性; VAE 依赖于复杂的替代损失函数,使优化变得复杂;和流模型需要专门的、可逆的架构。
扩散模型从非平衡热力学中汲取灵感,通过有效解决这些挑战提供了一种强大的替代方案。本书的突出之处在于仅关注扩散模型,提供了其他文本中很少见的独特视角。这种专注的方法不仅为更广泛的受众简化了复杂的想法,而且还突破了人工智能在现代工业和研究中所能实现的界限。因此,对于任何想要了解生成人工智能中技术驱动的创意过程当前和未来影响的人来说,本书都是必不可少的资源。
本书从基本概念开始,例如介绍布朗运动(最简单的扩散形式),然后逐渐深入到更复杂的扩散方程。这种结构化方法确保读者对前向和后向扩散过程有深刻的理解,为高级研究和应用提供坚实的基础。
本书详细探讨了关键概念,包括布朗运动、伊藤引理、随机微分方程 (SDE) 以及随机过程在人工智能中的重要作用。它对扩散过程进行了详尽的介绍,对 DDPM 进行了细致的检查,并有一章专门介绍了 DDPM 的基础深度学习架构。叙述内容丰富,包含大量已解决的问题和大量的编程小型项目,主要集中于与实际实现具有重大相关性的结果。作为一本内容广泛的研究生水平教科书和参考书,它秉承这样的理念:了解 DDPM 最有效的方法是通过其应用,并通过在现实场景中展示该理论的大量示例进行说明。
本书的每一章都将理论论述与实际应用相结合,最终以使用Python的迷你编程项目告终。这些项目允许读者模拟基本的理论概念,例如随机游走或布朗运动,并进一步实现更复杂的实现,例如开发 DDPM。这种实践方法不仅通过积极参与巩固学习,而且还为学生和专业人士提供了在各种现实环境中有效部署这些先进模型的技能。
此外,本书系统地涵盖了随机微分方程 (SDE)、布朗运动、鞅和伊藤引理等主题。这些主题在扩散模型的背景下相互关联,鼓励读者重新审视之前的讨论,以充分掌握这些概念之间复杂的相互关系。为了确保清晰度和可理解性,文本有意省略了一些更深奥的主题,而是专注于提供对于彻底理解 DDPM 至关重要的基础知识和深刻见解。
这份手稿富含大量完全解决的示例和不同复杂程度的练习,将它们整合到叙述中,以广泛地增强和评估读者的理解。这些练习是本书结构的核心,在随后的讨论中经常被引用,以鼓励动态和交互式的学习环境。
受著名的 Schaum 的大纲系列的启发,本书将严谨的理论阐述与实际应用结合起来。这种方法旨在通过实践解决问题来强化理论知识,从而增强理解力。
虽然主要重点是理论,但本书偶尔会包含代码片段,以弥合理论与实际应用之间的差距,使其成为致力于掌握扩散模型的研究生和专业人士的理想选择。
每章的每个部分的组织内容包括:
为了提高每一章的教学价值并巩固所提出的理论概念,本书以一系列实用的编程项目作为结尾。这些项目旨在弥合理论与实践之间的差距,使读者能够在模拟环境中应用新获得的知识。这种实践方法不仅可以增强理解,还可以提高在生成人工智能领域取得进步所必需的实践技能。
这些项目包括:
这些项目鼓励深入研究随机过程和扩散模型的实际方面,帮助读者解决现实世界的问题并在生成人工智能领域进行创新。