David Silver Reinforcement learning
1.0.0
该存储库包含 David Silver 的强化学习课程的笔记,以及所讨论的各种算法的实现,包括 Keras(带有 TensorFlow 后端)和 OpenAI 的gym 框架。
第 1 周:强化学习简介 [幻灯片][视频]
第 2 周:马尔可夫决策过程 [幻灯片][视频]
第 3 周:通过动态规划进行规划 [幻灯片][视频]
第 4 周:无模型预测 [幻灯片][视频]
第 5 周:无模型控制 [幻灯片][视频]
第 6 周:价值函数逼近 [幻灯片][视频]
第 7 周:政策梯度方法 [幻灯片][视频]
第 8 周:整合学习和规划 [幻灯片][视频]
第 9 周:探索和利用 [幻灯片][视频]
第 10 周:案例研究:经典游戏中的强化学习 [幻灯片][视频]
使用 pip 安装它们。
请随意创建 Pull Request,以添加 PyTorch、Caffe 等不同框架中讨论的算法的实现或改进现有的实现。如果您是初学者,可以参考此入门。
如果您发现这有用,请考虑为该存储库加注星标 (★),以便它可以覆盖更广泛的受众。
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅许可证文件。