このプロジェクトの目的は、さまざまなアルゴリズムによって訓練された深層強化学習エージェントを普及し、それらの分析、比較、視覚化を容易にできるようにすることです。期待は、強化学習エージェントを理解するためのさらなる研究のための摩擦を減らすことです。このプロジェクトは、優れた Lucid ニューラル ネットワーク視覚化ライブラリを利用し、Dopmine モデル リリースと統合します。
この研究を紹介する論文は、IJCAI 2019: An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents で公開されました。
このソフトウェア パッケージには、(1) さまざまな深層強化学習手法によって Atari ゲーム上でトレーニングされたフリーズ モデル、(2) オンラインでホストされているトレーニング環境でのエージェントのキャッシュされたゲームプレイ エクスペリエンスのバイナリ リリースが付属しています。
依存関係:
インストールするには、依存関係をインストールした後にsetup.py install
実行します。
import atari_zoo
from atari_zoo import MakeAtariModel
from pylab import *
algo = "a2c"
env = "ZaxxonNoFrameskip-v4"
run_id = 1
tag = "final"
m = MakeAtariModel ( algo , env , run_id , tag )()
# get observations, frames, and ram state from a representative rollout
obs = m . get_observations ()
frames = m . get_frames ()
ram = m . get_ram ()
# visualize first layer of convolutional weights
session = atari_zoo . utils . get_session ()
m . load_graphdef ()
m . import_graph ()
conv_weights = m . get_weights ( session , 0 )
atari_zoo . utils . visualize_conv_w ( conv_weights )
show ()
コマンドラインから次を実行できます: python -m atari_zoo.activation_movie --algo rainbow --environment PongNoFrameskip-v4 --run_id 1 --output ./pong_rainbow1_activation.mp4
jupyter ノートブックの例は、このライブラリの使用方法のさらなる例を提供するノートブック ディレクトリにあります。
スターター colab ノートブックを使用すると、ライブラリをダウンロードしてインストールせずにチェックアウトできます。
訓練を受けたエージェントのビデオを閲覧するためのツールはここから入手できます。特定のビデオ (例: https://uber-research.github.io/atari-model-zoo/video.html?algo=apex&game=Seaquest&tag=final&run=2) にリンクできることに注意してください。
訓練されたエージェントのビデオを神経活性化とともに表示するツールは、ここから入手できます。
私たちは 4 つのアルゴリズムを自分たちでトレーニングしました。
ドーパミン モデル リリースの 2 つのアルゴリズム (DQN と Rainbow) からトレーニングされた最終モデルを取得しました。
この著作物を出版物で引用するには、次の BibTex エントリを使用してください。
@inproceedings{
title = {An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents},
author = {Felipe Such, Vashish Madhavan, Rosanne Liu, Rui Wang, Pablo Castro, Yulun Li, Jiale Zhi, Ludwig Schubert, Marc G. Bellemare, Jeff Clune, Joel Lehman},
booktitle = {Proceedings of IJCAI 2019},
year = {2019},
}
質問、コメント、提案については、[email protected] まで電子メールでお問い合わせください。