(ร่าง, WIP, วันที่คาดว่าจะตีพิมพ์: สิ้นปี 2025 )
หนังสือเรียนเล่มนี้จัดทำขึ้นอย่างเชี่ยวชาญสำหรับ นักศึกษาระดับบัณฑิตศึกษา ในสาขาฟิสิกส์และวิทยาการคอมพิวเตอร์ โดยนำเสนอการสำรวจแบบจำลองความน่าจะเป็นแบบ Denoising Diffusion Probabilistic Models (DDPM) อย่างละเอียดตลอดทั้งภาคการศึกษาภายในสาขาที่กว้างขวางของ generative AI ซึ่งแตกต่างจากข้อความทั่วไปที่ใช้รูปแบบการพิสูจน์คำจำกัดความที่เข้มงวด หนังสือเล่มนี้ใช้น้ำเสียงที่ผ่อนคลายและเป็นบทสนทนามากขึ้น โดยผสมผสานคำอธิบายที่กว้างขวาง แรงจูงใจ และคำอธิบายเพื่อเพิ่มความเข้าใจและการมีส่วนร่วม
จนกระทั่งเมื่อไม่นานมานี้ แบบจำลองการแพร่กระจายเป็นเพียง กลุ่มนักวิทยาศาสตร์และวิศวกรบางกลุ่ม เท่านั้นที่รู้จัก Generative AI ซึ่งเป็นสาขาที่ต้องอาศัยโมเดลเหล่านี้อย่างมาก จำเป็นต้องมีความเข้าใจที่ซับซ้อนเกี่ยวกับคณิตศาสตร์ ฟิสิกส์ กระบวนการสุ่ม การเรียนรู้เชิงลึก และวิทยาการคอมพิวเตอร์
หนังสือเล่มนี้เจาะลึกเกี่ยวกับโมเดลการแพร่กระจายภายใน Generative AI โดยเฉพาะอย่างยิ่งมุ่งเน้นไปที่ โมเดล Denoising Diffusion Probabilistic (DDPM) แม้ว่าโมเดลเจนเนอเรทีฟอื่นๆ เช่น Generative Adversarial Networks (GAN), Variational Autoencoders (VAE) และโมเดลโฟลว์เบสได้พัฒนาการสร้างตัวอย่างคุณภาพสูงให้ก้าวหน้า แต่โมเดลแต่ละโมเดลก็มีข้อเสียเปรียบที่สำคัญ GAN สามารถสัมผัสกับการฝึกอบรมที่ไม่เสถียรและความหลากหลายของเอาต์พุตที่จำกัด VAE ขึ้นอยู่กับฟังก์ชันการสูญเสียตัวแทนที่ซับซ้อน และแบบจำลองการไหลจำเป็นต้องมีสถาปัตยกรรมเฉพาะทางที่สามารถพลิกกลับได้
แบบจำลองการแพร่กระจายซึ่งได้รับแรงบันดาลใจจากอุณหพลศาสตร์ที่ไม่สมดุล นำเสนอทางเลือกที่มีประสิทธิภาพโดยจัดการกับความท้าทายเหล่านี้อย่างมีประสิทธิภาพ หนังสือเล่มนี้โดดเด่นด้วยการมุ่งความสนใจไปที่แบบจำลองการแพร่กระจายเพียงอย่างเดียว ซึ่งนำเสนอมุมมองที่เป็นเอกลักษณ์ซึ่งหาได้ยากในตำราอื่น แนวทางที่มุ่งเน้นนี้ไม่เพียงแต่ช่วยลดความซับซ้อนของแนวคิดที่ซับซ้อนสำหรับผู้ชมในวงกว้างเท่านั้น แต่ยังผลักดันขอบเขตของสิ่งที่ AI สามารถทำได้ในอุตสาหกรรมและการวิจัยสมัยใหม่อีกด้วย ด้วยเหตุนี้ หนังสือเล่มนี้จึงเป็นแหล่งข้อมูลสำคัญสำหรับทุกคนที่ต้องการทำความเข้าใจผลกระทบในปัจจุบันและอนาคตของกระบวนการสร้างสรรค์ที่ขับเคลื่อนด้วยเทคโนโลยีใน Generative AI
หนังสือเล่มนี้เริ่มต้นด้วยแนวคิดพื้นฐาน เช่น การแนะนำการเคลื่อนที่แบบบราวเนียน ซึ่งเป็นรูปแบบการแพร่กระจายที่ง่ายที่สุด และค่อยๆ ก้าวไปสู่สมการการแพร่กระจายที่ซับซ้อนมากขึ้น วิธีการที่มีโครงสร้างนี้ทำให้มั่นใจได้ว่าผู้อ่านจะพัฒนาความเข้าใจอย่างลึกซึ้งเกี่ยวกับกระบวนการแพร่กระจายทั้งแบบไปข้างหน้าและย้อนกลับ ซึ่งเป็นรากฐานที่มั่นคงสำหรับการศึกษาและการประยุกต์ขั้นสูง
หนังสือเล่มนี้นำเสนอการสำรวจแนวคิดหลักโดยละเอียด รวมถึงการเคลื่อนที่แบบบราวเนียน, บทแทรกของ Itô, สมการเชิงอนุพันธ์สุ่ม (SDE) และบทบาทสำคัญของกระบวนการสุ่มในปัญญาประดิษฐ์ โดยจะให้การแนะนำอย่างละเอียดถี่ถ้วนเกี่ยวกับกระบวนการแพร่กระจาย การตรวจสอบ DDPM อย่างพิถีพิถัน และบทที่อุทิศให้กับสถาปัตยกรรมการเรียนรู้เชิงลึกที่เป็นพื้นฐานของ DDPM การบรรยาย เต็มไปด้วยปัญหาที่ได้รับการแก้ไขมากมาย และ มินิโปรเจ็กต์การเขียนโปรแกรม จำนวนมาก โดยเน้นไปที่ผลลัพธ์ที่มีความเกี่ยวข้องอย่างมากสำหรับการนำไปปฏิบัติจริง เนื่องจากเป็นตำราเรียนและข้อมูลอ้างอิงระดับบัณฑิตศึกษาที่ครอบคลุม จึงรวบรวมปรัชญาที่ว่าวิธีที่มีประสิทธิภาพที่สุดในการเรียนรู้เกี่ยวกับ DDPM คือผ่านการประยุกต์ใช้ ซึ่งแสดงตัวอย่างผ่านตัวอย่างมากมายที่แสดงให้เห็นถึงทฤษฎีในสถานการณ์จริง
แต่ละบทของหนังสือเล่มนี้ผสมผสานวาทกรรมเชิงทฤษฎีเข้ากับการใช้งานจริง โดยปิดท้ายด้วยโปรเจ็กต์การเขียนโปรแกรมขนาดเล็ก โดยใช้ Python โปรเจ็กต์เหล่านี้ช่วยให้ผู้อ่านจำลองแนวคิดทางทฤษฎีพื้นฐาน เช่น การเดินแบบสุ่มหรือการเคลื่อนที่แบบบราวเนียน และดำเนินการไปสู่การใช้งานที่ซับซ้อนมากขึ้น เช่น การพัฒนา DDPM วิธีการลงมือปฏิบัติจริงนี้ไม่เพียงแต่ทำให้การเรียนรู้แข็งแกร่งขึ้นผ่านการมีส่วนร่วมอย่างกระตือรือร้น แต่ยังช่วยให้นักเรียนและผู้เชี่ยวชาญมีทักษะในการปรับใช้โมเดลขั้นสูงเหล่านี้ในบริบทโลกแห่งความเป็นจริงต่างๆ ได้อย่างมีประสิทธิภาพ
นอกจากนี้ ข้อความยังครอบคลุมหัวข้ออย่างเป็นระบบ เช่น สมการเชิงอนุพันธ์สุ่ม (SDE), การเคลื่อนที่แบบบราวเนียน, martingales และบทแทรกของ Itô หัวข้อเหล่านี้เชื่อมโยงกันภายในบริบทของแบบจำลองการแพร่กระจาย กระตุ้นให้ผู้อ่านทบทวนการอภิปรายก่อนหน้านี้เพื่อเข้าใจความสัมพันธ์ที่ซับซ้อนระหว่างแนวคิดเหล่านี้อย่างเต็มที่ เพื่อให้มั่นใจถึงความชัดเจนและการเข้าถึงได้ ข้อความจึงตั้งใจละเว้นหัวข้อที่ลึกลับบางหัวข้อ แทนที่จะมุ่งเน้นไปที่การให้ความรู้พื้นฐานและข้อมูลเชิงลึกที่จำเป็นสำหรับการทำความเข้าใจ DDPM อย่างถี่ถ้วน
ต้นฉบับนี้ เต็มไปด้วยตัวอย่างและแบบฝึกหัดที่แก้ไขได้อย่างสมบูรณ์และมีความซับซ้อนต่างกันออกไปมากมาย และได้รวมสิ่งเหล่านี้เข้ากับการเล่าเรื่องเพื่อปรับปรุงและประเมินความเข้าใจของผู้อ่านอย่างกว้างขวาง แบบฝึกหัดเหล่านี้เป็นศูนย์กลางของโครงสร้างของหนังสือ ซึ่งมักอ้างอิงในการอภิปรายครั้งต่อๆ ไป เพื่อส่งเสริมสภาพแวดล้อมการเรียนรู้แบบโต้ตอบและมีชีวิตชีวา
แรงบันดาลใจจาก ซีรีส์ Schaum's Outline ที่มีชื่อเสียง ข้อความนี้ผสมผสานการอธิบายทางทฤษฎีที่เข้มงวดเข้ากับการใช้งานจริง วิธีการนี้จัดทำขึ้นเพื่อเสริมสร้างความรู้ทางทฤษฎีผ่าน การแก้ปัญหาแบบลงมือปฏิบัติจริง ซึ่งจะเป็นการเพิ่มความเข้าใจ
แม้ว่าเนื้อหาหลักจะเน้นไปทางทฤษฎี แต่ในบางครั้งข้อความก็รวมเอาโค้ดบางส่วนเข้าด้วยกันเพื่อลดช่องว่างระหว่างทฤษฎีและการประยุกต์ใช้ในทางปฏิบัติ ทำให้เหมาะสำหรับนักศึกษาระดับบัณฑิตศึกษาและผู้เชี่ยวชาญที่มุ่งมั่นที่จะเชี่ยวชาญโมเดลการแพร่กระจาย
แต่ละส่วนของแต่ละบทได้รับการจัดระเบียบเพื่อรวม:
เพื่อเพิ่มคุณค่าการสอนของแต่ละบทและทำให้แนวคิดทางทฤษฎีที่นำเสนอมีความเข้มแข็ง ข้อความจึงสรุปด้วยชุดโครงการการเขียนโปรแกรมเชิงปฏิบัติ โครงการเหล่านี้ได้รับการออกแบบเพื่อลดช่องว่างระหว่างทฤษฎีและการปฏิบัติ ช่วยให้ผู้อ่านสามารถนำความรู้ที่ได้รับใหม่ไปใช้ในสภาพแวดล้อมจำลอง วิธีการลงมือปฏิบัติจริงนี้ไม่เพียงแต่เสริมความเข้าใจเท่านั้น แต่ยังเพิ่มพูนทักษะการปฏิบัติที่จำเป็นสำหรับการพัฒนาความก้าวหน้าในด้าน Generative AI อีกด้วย
โครงการต่างๆ ได้แก่:
โครงการเหล่านี้ส่งเสริมให้เจาะลึกแง่มุมเชิงปฏิบัติของกระบวนการสุ่มและแบบจำลองการแพร่กระจาย เตรียมผู้อ่านให้พร้อมรับมือกับปัญหาในโลกแห่งความเป็นจริง และสร้างนวัตกรรมภายในขอบเขตของ generative AI