atari model zoo Download - atari model zoo Quellcode herunterladen

atari model zoo

AI-Quellcode

1.0.0

Herunterladen

Atari-Zoo

Das Ziel dieses Projekts ist die Verbreitung von Deep-Reinforcement-Learning-Agenten, die mit einer Vielzahl von Algorithmen trainiert wurden, und deren einfache Analyse, Vergleich und Visualisierung zu ermöglichen. Die Hoffnung besteht darin, die Reibung für weitere Forschungen zum Verständnis von Reinforcement-Learning-Agenten zu verringern. Dieses Projekt nutzt die hervorragende Visualisierungsbibliothek für neuronale Netzwerke von Lucid und lässt sich in die Dopamin-Modellversion integrieren.

Ein Artikel, der diese Arbeit vorstellt, wurde auf der IJCAI 2019 veröffentlicht: An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents.

Um

Dieses Softwarepaket wird von einer Binärversion von (1) eingefrorenen Modellen begleitet, die mit einer Vielzahl tiefgreifender Reinforcement-Learning-Methoden auf Atari-Spielen trainiert wurden, und (2) zwischengespeicherter Spielerfahrung dieser Agenten in ihren Trainingsumgebungen, die online gehostet wird.

Installation und Einrichtung

Abhängigkeiten:

Tensorflow (mit Version >0.8 <2.0; wir unterstützen TF 2.x derzeit nicht )
lucid (Version
matplotlib für einige Visualisierungen
moviepy (optional zum Erstellen von Filmen)
Fitnessstudio (installiert mit Unterstützung für Atari; optional zur Generierung neuer Rollouts)
opencv-python (optional zum Generieren neuer Rollouts)
tensorflow-onnx (optional für den Export in das ONNX-Format)

Führen Sie zur Installation setup.py install aus, nachdem Sie die Abhängigkeiten installiert haben.

Beispiele

 import atari_zoo
from atari_zoo import MakeAtariModel
from pylab import *

algo = "a2c"
env = "ZaxxonNoFrameskip-v4"
run_id = 1
tag = "final"
m = MakeAtariModel ( algo , env , run_id , tag )()

# get observations, frames, and ram state from a representative rollout
obs = m . get_observations ()
frames = m . get_frames ()
ram = m . get_ram ()

# visualize first layer of convolutional weights
session = atari_zoo . utils . get_session ()

m . load_graphdef ()
m . import_graph ()

conv_weights = m . get_weights ( session , 0 )
atari_zoo . utils . visualize_conv_w ( conv_weights )
show ()

Von der Befehlszeile aus können Sie Folgendes ausführen: python -m atari_zoo.activation_movie --algo rainbow --environment PongNoFrameskip-v4 --run_id 1 --output ./pong_rainbow1_activation.mp4

Notizbücher

Im Notebook-Verzeichnis befinden sich Beispiel-Jupyter-Notebooks, die weitere Beispiele für die Verwendung dieser Bibliothek enthalten.

Mit einem Starter-Colab-Notebook können Sie die Bibliothek ausprobieren, ohne sie herunterladen und installieren zu müssen.

Web-Tools

Ein Tool zum Ansehen von Videos geschulter Agenten ist hier verfügbar; Beachten Sie, dass es möglich ist, auf bestimmte Videos zu verlinken, z. B. https://uber-research.github.io/atari-model-zoo/video.html?algo=apex&game=Seaquest&tag=final&run=2.
Ein Tool zum Anzeigen von Videos geschulter Agenten zusammen mit ihren neuronalen Aktivierungen ist hier verfügbar.

Quellcode für Trainingsalgorithmen, die Zoomodelle erstellt haben

Wir haben selbst vier Algorithmen trainiert:

A2C – wir haben das Baselines-Paket von OpenAI verwendet
GA – wir haben die von Uber veröffentlichte schnelle GPU-Implementierungsversion verwendet
ES – wir haben die von Uber veröffentlichte schnelle GPU-Version verwendet
Ape-X – wir haben die von Uber veröffentlichte Replikation verwendet
IMPALA – wir haben den veröffentlichten Code von DeepMind verwendet

Wir haben trainierte endgültige Modelle von zwei Algorithmen (DQN und Rainbow) aus der Dopamin-Modellversion übernommen:

DQN – Umsetzung hier
Rainbow - Umsetzung hier

Zitat

Um dieses Werk in Publikationen zu zitieren, verwenden Sie bitte den folgenden BibTex-Eintrag:

 @inproceedings{
title = {An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents},
author = {Felipe Such, Vashish Madhavan, Rosanne Liu, Rui Wang, Pablo Castro, Yulun Li, Jiale Zhi, Ludwig Schubert, Marc G. Bellemare, Jeff Clune, Joel Lehman},
booktitle = {Proceedings of IJCAI 2019},
year = {2019},
}