David Silver Reinforcement learning
1.0.0
このリポジトリには、David Silver による強化学習コースのメモと、Keras (TensorFlow バックエンドを使用) と OpenAI のジム フレームワークの両方で説明したさまざまなアルゴリズムの実装が含まれています。
第 1 週: 強化学習の概要 [スライド][ビデオ]
第 2 週: マルコフの意思決定プロセス [スライド][ビデオ]
第 3 週: 動的プログラミングによる計画 [スライド][ビデオ]
第 4 週: モデルフリー予測 [スライド][ビデオ]
第 5 週: モデルフリーの制御 [スライド][ビデオ]
第 6 週: 値関数の近似 [スライド][ビデオ]
第 7 週: ポリシーの勾配手法 [スライド][ビデオ]
第 8 週: 学習と計画の統合 [スライド][ビデオ]
第 9 週: 探索と活用 [スライド][ビデオ]
第 10 週: ケーススタディ: クラシック ゲームにおける RL [スライド][ビデオ]
pip を使用してインストールします。
PyTorch、Caffe などのさまざまなフレームワークで説明されているアルゴリズムの実装を追加したり、既存の実装を改善したりする場合は、お気軽にプル リクエストを作成してください。初心者の方はこちらを参考にして始めてください。
これが役に立ったと思われる場合は、より多くの視聴者に届くように、リポジトリにスター (★) を付けることをご検討ください。
このプロジェクトは MIT ライセンスに基づいてライセンスされています。詳細については、LICENSE ファイルを参照してください。