พื้นที่เก็บข้อมูลนี้ประกอบด้วยบันทึกสำหรับหลักสูตรการเรียนรู้แบบเสริมกำลังโดย David Silver พร้อมด้วยการนำอัลกอริทึมต่างๆ ที่กล่าวถึงไปใช้ ทั้งใน Keras (พร้อมแบ็กเอนด์ TensorFlow) และเฟรมเวิร์กยิมของ OpenAI
สัปดาห์ที่ 1: ความรู้เบื้องต้นเกี่ยวกับการเรียนรู้แบบเสริมกำลัง [สไลด์] [วิดีโอ]
สัปดาห์ที่ 2: กระบวนการตัดสินใจของมาร์คอฟ [สไลด์] [วิดีโอ]
สัปดาห์ที่ 3: การวางแผนโดยการเขียนโปรแกรมแบบไดนามิก [สไลด์] [วิดีโอ]
สัปดาห์ที่ 4: การทำนายแบบไม่มีโมเดล [สไลด์] [วิดีโอ]
สัปดาห์ที่ 5: การควบคุมแบบไม่มีโมเดล [สไลด์] [วิดีโอ]
สัปดาห์ที่ 6: การประมาณฟังก์ชันค่า [สไลด์] [วิดีโอ]
สัปดาห์ที่ 7: วิธีการไล่ระดับนโยบาย [สไลด์] [วิดีโอ]
สัปดาห์ที่ 8: การบูรณาการการเรียนรู้และการวางแผน [สไลด์] [วิดีโอ]
สัปดาห์ที่ 9: การสำรวจและการแสวงหาผลประโยชน์ [สไลด์] [วิดีโอ]
สัปดาห์ที่ 10: กรณีศึกษา: RL ในเกมคลาสสิก [สไลด์] [วิดีโอ]
ติดตั้งโดยใช้ pip
โปรดอย่าลังเลที่จะสร้าง Pull Request เพื่อเพิ่มการใช้งานอัลกอริธึมที่กล่าวถึงในเฟรมเวิร์กที่แตกต่างกัน เช่น PyTorch, Caffe ฯลฯ หรือปรับปรุงการใช้งานที่มีอยู่ หากคุณเป็นมือใหม่ คุณสามารถดูสิ่งนี้เพื่อเริ่มต้นใช้งาน
หากคุณพบว่าสิ่งนี้มีประโยชน์ โปรดพิจารณาติดดาว(★) ที่เก็บคืนเพื่อให้สามารถเข้าถึงผู้ชมในวงกว้างขึ้น
โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT - ดูรายละเอียดในไฟล์ใบอนุญาต