Repositori ini berisi catatan untuk kursus Reinforcement Learning oleh David Silver beserta implementasi berbagai algoritma yang dibahas, baik di Keras (dengan backend TensorFlow) dan framework gym OpenAI.
Minggu 1: Pengantar Pembelajaran Penguatan [slide][video]
Minggu 2: Proses Keputusan Markov [slide][video]
Minggu 3: Perencanaan dengan Pemrograman Dinamis [slide][video]
Minggu 4: Prediksi Tanpa Model [slide][video]
Minggu 5: Kontrol Tanpa Model [slide][video]
Minggu 6: Perkiraan Fungsi Nilai [slide][video]
Minggu 7: Metode Gradien Kebijakan [slide][video]
Minggu 8: Mengintegrasikan Pembelajaran dan Perencanaan [slide][video]
Minggu 9: Eksplorasi dan Eksploitasi [slide][video]
Minggu 10: Studi Kasus: RL di Game Klasik [slide][video]
Instal menggunakan pip.
Silakan membuat Permintaan Tarik untuk menambahkan implementasi algoritma yang dibahas dalam kerangka kerja berbeda seperti PyTorch, Caffe, dll. atau meningkatkan implementasi yang sudah ada. Jika Anda seorang pemula, Anda bisa merujuk ini untuk memulai.
Jika menurut Anda ini berguna, harap pertimbangkan untuk membintangi (★) repo sehingga dapat menjangkau khalayak yang lebih luas.
Proyek ini dilisensikan di bawah Lisensi MIT - lihat file LISENSI untuk detailnya.