Venho estudando aprendizagem por reforço e tomada de decisão há alguns anos. Uma das coisas mais difíceis que encontrei não está necessariamente relacionada aos conceitos, mas à forma como esses conceitos foram explicados. Para mim, o aprendizado ocorre quando se consegue fazer uma conexão com os conceitos que estão sendo ensinados. Para isso, muitas vezes é necessária uma explicação intuitiva e, provavelmente, uma abordagem prática ajuda a construir esse tipo de compreensão.
Meu objetivo com este repositório é criar, com a comunidade, um recurso que ajude os recém-chegados a compreender a aprendizagem por reforço de forma intuitiva. Considere o que você vê aqui, minha tentativa inicial de ensinar alguns desses conceitos da maneira mais clara e simples possível para explicá-los.
Se você quiser colaborar, seja um erro de digitação ou um acréscimo completo ao texto, talvez uma correção em um caderno ou um caderno totalmente novo, sinta-se à vontade para enviar seu problema e/ou pull request para melhorar as coisas. Contanto que sua solicitação pull esteja alinhada com o objetivo do repositório, é muito provável que ocorra uma fusão. Não sou o melhor professor ou pesquisador de aprendizagem por reforço, mas acredito que podemos tornar a aprendizagem por reforço e a tomada de decisões fáceis de entender para qualquer pessoa. Bem, pelo menos mais fácil.
Este repositório contém Jupyter Notebooks para acompanhar as palestras. No entanto, existem vários pacotes e aplicativos que precisam ser instalados. Para facilitar as coisas para você, demorei um pouco mais para configurar um ambiente reproduzível que você possa usar para acompanhar.
Siga as instruções em (https://git-scm.com/book/en/v2/Getting-Started-Installing-Git)
Siga as instruções em (https://docs.docker.com/engine/getstarted/step_one/#step-2-install-docker)
git clone [email protected]:mimoralea/applied-reinforcement-learning.git && cd applied-reinforcement-learning
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
git clone [email protected]:mimoralea/applied-reinforcement-learning.git ~/Projects/applied-reinforcement-learning
)cd ~/Projects/applied-reinforcement-learning
)docker build -t mimoralea/openai-gym:v1 .
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
http://localhost:8888
(ou siga o link que saiu do comando de execução sobre o qual incluirá o token) http://localhost:6006
Isso o ajudará a visualizar a Rede Neural nas aulas com aproximação de função.
docker ps
# mostrará os contêineres em execução no momento - observe o ID do contêiner que você está tentando acessardocker exec --user root -it c3fbc82f1b49 /bin/bash
# neste caso c3fbc82f1b49 é o iddocker run -it --rm mimoralea/openai-gym:v1 /bin/bash
# isso executará a sessão bash como o usuário do Notebookdocker run --user root -e GRANT_SUDO=yes -it --rm mimoralea/openai-gym:v1 /bin/bash
# isso executará a sessão bash como root