私はここ数年、強化学習と意思決定について研究しています。私が遭遇した最も難しいことの 1 つは、必ずしも概念に関連しているわけではなく、それらの概念がどのように説明されているかということです。私にとって、学習とは、教えられている概念と結びつけることができたときに起こります。このためには、直感的な説明が必要になることが多く、おそらく実践的なアプローチがその種の理解を構築するのに役立ちます。
このリポジトリの私の目標は、初心者が直感的な方法で強化学習を理解するのに役立つリソースをコミュニティと協力して作成することです。ここにあるものを考えてください。これらの概念のいくつかをできるだけわかりやすく簡単に説明しようとした私の最初の試みを考えてください。
タイプミスであれ、テキストへの全体的な追加であれ、おそらくノートブックの修正であれ、まったく新しいノートブックであれ、共同作業をご希望の場合は、状況を改善するためにお気軽に問題やプルリクエストを送信してください。プルリクエストがリポジトリの目標と一致している限り、マージされる可能性が非常に高くなります。私は優れた教師でも強化学習の研究者でもありませんが、強化学習と意思決定を誰でも簡単に理解できるようにすることはできると信じています。まあ、少なくとも簡単です。
このリポジトリには、講義に沿って学習できる Jupyter Notebook が含まれています。ただし、インストールする必要があるパッケージとアプリケーションがいくつかあります。作業を簡単にするために、手順に沿って使用できる再現可能な環境をセットアップするのに少し長い時間を費やしました。
(https://git-scm.com/book/en/v2/Getting-Started-Installing-Git) の手順に従ってください。
(https://docs.docker.com/engine/getstarted/step_one/#step-2-install-docker) の手順に従ってください。
git clone [email protected]:mimoralea/applied-reinforcement-learning.git && cd applied-reinforcement-learning
docker pull mimoralea/openai-gym:v1
docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
git clone [email protected]:mimoralea/applied-reinforcement-learning.git ~/Projects/applied-reinforcement-learning
)cd ~/Projects/applied-reinforcement-learning
)docker build -t mimoralea/openai-gym:v1 .
docker pull mimoralea/openai-gym:v1
を使用します。docker run -it --rm -p 8888:8888 -p 6006:6006 -v $PWD/notebooks/:/mnt/notebooks/ mimoralea/openai-gym:v1
http://localhost:8888
(または、トークンが含まれる run コマンドから出たリンクをたどります) http://localhost:6006
これは、関数近似を使用したレッスンでニューラル ネットワークを視覚化するのに役立ちます。
docker ps
# は現在実行中のコンテナを表示します -- アクセスしようとしているコンテナの ID に注意してくださいdocker exec --user root -it c3fbc82f1b49 /bin/bash
# この場合、c3fbc82f1b49 は ID ですdocker run -it --rm mimoralea/openai-gym:v1 /bin/bash
# これにより、bash セッションが Notebook ユーザーとして実行されますdocker run --user root -e GRANT_SUDO=yes -it --rm mimoralea/openai-gym:v1 /bin/bash
# これにより、bash セッションが root として実行されます