David Silver Reinforcement learning
1.0.0
該儲存庫包含 David Silver 的密集學習課程的筆記,以及所討論的各種演算法的實現,包括 Keras(帶有 TensorFlow 後端)和 OpenAI 的gym 框架。
第 1 週:強化學習簡介 [投影片][影片]
第 2 週:馬可夫決策過程 [幻燈片][影片]
第 3 週:透過動態規劃進行規劃 [幻燈片][影片]
第 4 週:無模型預測 [幻燈片][影片]
第 5 週:無模型控制 [幻燈片][影片]
第 6 週:價值函數逼近 [幻燈片][影片]
第 7 週:政策梯度方法 [幻燈片][影片]
第 8 週:整合學習與規劃 [幻燈片][影片]
第 9 週:探索與利用 [幻燈片][影片]
第 10 週:案例研究:經典遊戲中的強化學習 [幻燈片][影片]
使用 pip 安裝它們。
請隨意建立 Pull Request,以添加 PyTorch、Caffe 等不同框架中討論的演算法的實作或改進現有的實作。如果您是初學者,可以參考此入門。
如果您發現這有用,請考慮為該儲存庫加註星標 (★),以便它可以覆蓋更廣泛的受眾。
該項目根據 MIT 許可證獲得許可 - 有關詳細信息,請參閱許可證文件。