applied reinforcement learning
1.0.0
我研究强化学习和决策已经有几年了。我遇到的最困难的事情之一不一定与概念有关,而是与如何解释这些概念有关。对我来说,当一个人能够与所教授的概念建立联系时,学习就发生了。为此,通常需要直观的解释,并且实践方法可能有助于建立这种理解。
我创建这个存储库的目标是与社区一起创建一个资源,帮助新手以直观的方式理解强化学习。考虑一下您在这里看到的内容,我最初尝试尽可能简单明了地教授其中一些概念。
如果您愿意合作,无论是拼写错误还是对文本的全部添加,也许是对笔记本或全新笔记本的修复,请随时发送您的问题和/或拉取请求以使事情变得更好。只要您的拉取请求与存储库的目标一致,我们很可能会合并。我不是最好的老师,也不是强化学习研究者,但我相信我们可以让强化学习和决策变得容易为任何人所理解。好吧,至少更容易。
该存储库包含可与讲座一起使用的 Jupyter Notebooks。但是,有几个软件包和应用程序需要安装。为了让您更轻松,我花了更长的时间来设置一个可重现的环境,您可以使用它来进行后续操作。
按照 (https://git-scm.com/book/en/v2/Getting-Started-Installing-Git) 中的说明进行操作
按照 (https://docs.docker.com/engine/getstarted/step_one/#step-2-install-docker) 中的说明进行操作
git clone [email protected]:mimoralea/applied-reinforcement-learning.git && cd applied-reinforcement-learning
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
git clone [email protected]:mimoralea/applied-reinforcement-learning.git ~/Projects/applied-reinforcement-learning
)cd ~/Projects/applied-reinforcement-learning
)docker build -t mimoralea/openai-gym:v1 .
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
http://localhost:8888
(或者点击运行命令中出现的链接,其中将包含令牌) http://localhost:6006
这将帮助您在课程中通过函数逼近可视化神经网络。
docker ps
# 将显示当前正在运行的容器——记下您尝试访问的容器的 IDdocker exec --user root -it c3fbc82f1b49 /bin/bash
# 在本例中 c3fbc82f1b49 是 iddocker run -it --rm mimoralea/openai-gym:v1 /bin/bash
# 这将以笔记本用户身份运行 bash 会话docker run --user root -e GRANT_SUDO=yes -it --rm mimoralea/openai-gym:v1 /bin/bash
# 这将以 root 身份运行 bash 会话