저는 몇 년 동안 강화 학습과 의사 결정을 연구해 왔습니다. 제가 직면한 가장 어려운 것 중 하나는 반드시 개념과 관련이 있는 것이 아니라 이러한 개념이 어떻게 설명되었는지였습니다. 나에게 학습은 가르치는 개념과 연결될 수 있을 때 발생합니다. 이를 위해서는 직관적인 설명이 필요한 경우가 많으며, 실제적인 접근 방식이 그러한 종류의 이해를 구축하는 데 도움이 될 수 있습니다.
이 저장소에 대한 나의 목표는 커뮤니티와 함께 초보자가 강화 학습을 직관적인 방식으로 이해하는 데 도움이 되는 리소스를 만드는 것입니다. 내가 설명할 수 있는 것처럼 단순하고 단순하게 이러한 개념 중 일부를 가르치려는 나의 초기 시도를 여기에서 볼 수 있습니다.
오타, 텍스트의 전체 추가, 노트북의 수정 또는 완전히 새로운 노트북 등 공동 작업을 원할 경우 상황을 개선할 수 있도록 자유롭게 문제 및/또는 끌어오기 요청을 보내주세요. 귀하의 풀 요청이 저장소의 목표와 일치하는 한 병합될 가능성이 매우 높습니다. 저는 최고의 교사나 강화학습 연구자는 아니지만 강화학습과 의사결정을 누구나 쉽게 이해할 수 있도록 만들 수 있다고 믿습니다. 글쎄, 적어도 더 쉽습니다.
이 저장소에는 강의를 따라갈 수 있는 Jupyter 노트북이 포함되어 있습니다. 그러나 설치해야 할 여러 패키지와 애플리케이션이 있습니다. 여러분의 작업을 더 쉽게 하기 위해 여러분이 따라할 수 있는 재현 가능한 환경을 설정하는 데 조금 더 오랜 시간이 걸렸습니다.
(https://git-scm.com/book/en/v2/Getting-Started-Installing-Git)의 지침을 따르세요.
(https://docs.docker.com/engine/getstarted/step_one/#step-2-install-docker)의 지침을 따르세요.
git clone [email protected]:mimoralea/applied-reinforcement-learning.git && cd applied-reinforcement-learning
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
git clone [email protected]:mimoralea/applied-reinforcement-learning.git ~/Projects/applied-reinforcement-learning
)cd ~/Projects/applied-reinforcement-learning
).docker build -t mimoralea/openai-gym:v1 .
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
http://localhost:8888
(또는 토큰이 포함된 실행 명령에서 나온 링크를 따라가세요) http://localhost:6006
이는 함수 근사를 사용하여 수업에서 신경망을 시각화하는 데 도움이 됩니다.
docker ps
#은 현재 실행 중인 컨테이너를 표시합니다. 액세스하려는 컨테이너의 ID를 기록해 두십시오.docker exec --user root -it c3fbc82f1b49 /bin/bash
# 이 경우 c3fbc82f1b49가 ID입니다.docker run -it --rm mimoralea/openai-gym:v1 /bin/bash
# 그러면 노트북 사용자로 bash 세션이 실행됩니다.docker run --user root -e GRANT_SUDO=yes -it --rm mimoralea/openai-gym:v1 /bin/bash
# 이렇게 하면 bash 세션이 루트로 실행됩니다.