(ドラフト、WIP、出版予定日: 2025 年末)
この教科書は、物理学とコンピューター サイエンスの大学院生向けに専門的に作成されており、生成 AI の広大な分野におけるノイズ除去拡散確率モデル (DDPM) を 1 学期にわたって徹底的に探索することができます。厳密な定義、定理、証明の形式に従う従来のテキストとは異なり、この本はよりリラックスした会話的なトーンを採用しており、理解と参加を高めるための広範な解説、動機、説明が組み込まれています。
最近まで、拡散モデルは科学者やエンジニアの選ばれたグループだけが知っているニッチな分野でした。これらのモデルに大きく依存する分野である生成 AI では、数学、物理学、確率過程、深層学習、コンピューター サイエンスの複雑な理解が必要です。
この本では、生成 AI 内の拡散モデルを深く掘り下げ、特にノイズ除去拡散確率モデル (DDPM)に焦点を当てています。敵対的生成ネットワーク (GAN)、変分オートエンコーダー (VAE)、フローベース モデルなどの他の生成モデルは、高品質のサンプルの生成を進歩させてきましたが、それぞれに重大な欠点があります。 GAN では、トレーニングが不安定になり、出力の多様性が制限される可能性があります。 VAE は複雑な代理損失関数に依存しているため、最適化が複雑になります。そしてフローモデルには、特殊化された可逆的なアーキテクチャが必要です。
非平衡熱力学からインスピレーションを得た拡散モデルは、これらの課題に効果的に対処することにより、堅牢な代替手段を提供します。この本は拡散モデルのみに焦点を当てている点で際立っており、他のテキストではめったに見られないユニークな視点を提供しています。この焦点を絞ったアプローチは、より幅広い視聴者向けに複雑なアイデアを単純化するだけでなく、現代の産業や研究において AI が達成できることの限界を押し広げます。そのため、この本は、Generative AI におけるテクノロジー主導の創造的なプロセスの現在および将来の影響を理解しようとする人にとって不可欠なリソースです。
この本は、拡散の最も単純な形式であるブラウン運動の導入などの基本的な概念から始まり、徐々により複雑な拡散方程式に進みます。この構造化されたアプローチにより、読者は前方拡散プロセスと後方拡散プロセスの両方について深い理解を深め、高度な研究と応用のための強固な基盤を提供します。
この本では、ブラウン運動、伊藤の補題、確率微分方程式 (SDE)、人工知能における確率過程の重要な役割などの重要な概念を詳しく説明しています。拡散プロセスの徹底的な紹介、DDPM の綿密な調査、および DDPM の基礎となる深層学習アーキテクチャに特化した章を提供します。この物語は、解決された多数の問題と多数のプログラミング ミニプロジェクトで充実しており、主に実際の実装に実質的な関連性を持つ結果に焦点を当てています。広範な大学院レベルの教科書および参考資料として、DDPM について学ぶ最も効果的な方法はその応用を通じてであるという哲学を採用しており、現実世界のシナリオで理論を実証する広範な例を通じて説明されています。
この本の各章では、理論的な議論と実践的なアプリケーションが統合されており、最終的にはPython を使用したミニ プログラミング プロジェクトで終わります。これらのプロジェクトにより、読者はランダム ウォークやブラウン運動などの基本的な理論概念をシミュレートし、DDPM の開発など、より高度な実装に進むことができます。この実践的なアプローチは、積極的な取り組みを通じて学習を強化するだけでなく、学生や専門家にこれらの高度なモデルを現実世界のさまざまな状況で効果的に展開するスキルを身につけます。
さらに、このテキストでは、確率微分方程式 (SDE)、ブラウン運動、マルチンゲール、伊藤の補題などのトピックを系統的に取り上げています。これらのトピックは普及モデルのコンテキスト内で相互にリンクされており、読者は以前の議論を再訪してこれらの概念間の複雑な相互関係を完全に理解することが勧められます。明瞭さとアクセシビリティを確保するために、本文ではいくつかの難解なトピックを意図的に省略し、代わりに DDPM を完全に理解するために不可欠な基礎知識と深い洞察を提供することに重点を置いています。
この原稿には、完全に解決されたさまざまな複雑さの膨大な例と演習が豊富に含まれており、これらを物語に統合して、読者の理解を広範囲に強化および評価します。これらの演習は本の構造の中心であり、ダイナミックでインタラクティブな学習環境を促進するためにその後の議論でよく参照されます。
有名な Schaum のアウトライン シリーズに触発されたこのテキストは、厳密な理論的説明と実際の応用を組み合わせています。この方法論は、実践的な問題解決を通じて理論的知識を強化し、理解を高めるように作成されています。
主に理論に焦点を当てていますが、テキストには理論と実際の応用の間のギャップを埋めるためのコード スニペットが時折組み込まれており、拡散モデルの習得に取り組む大学院生や専門家にとって理想的な内容となっています。
各章の各セクションは次の内容で構成されています。
各章の教育的価値を高め、提示された理論的概念を強化するために、テキストは一連の実践的なプログラミング プロジェクトで終わります。これらのプロジェクトは、理論と実践の間のギャップを埋めるように設計されており、読者が新しく獲得した知識をシミュレートされた環境で適用できるようにします。この実践的なアプローチは理解を強化するだけでなく、生成 AI の分野で進歩するために不可欠な実践的なスキルを磨きます。
プロジェクトには次のものが含まれます。
これらのプロジェクトは、確率過程と拡散モデルの実践的な側面を深く掘り下げることを奨励し、読者が現実世界の問題に取り組み、生成 AI の領域内で革新する準備を整えます。