Gym ist eine Open -Source -Python -Bibliothek zum Entwickeln und Vergleich von Verstärkungslernenalgorithmen, indem eine Standard -API zur Kommunikation zwischen Lernalgorithmen und -umgebungen sowie einer Standardmenge von Umgebungen, die dieser API entspricht, kommunizieren. Seit seiner Veröffentlichung ist die API des Gymnast die Feldstandard dafür geworden.
Die Website der Fitnessdokumentation finden Sie unter https://www.gymlibrary.dev/, und Sie können hier Korrekturen und Änderungen vorschlagen.
Fitnessstudio verfügt auch über einen Discord -Server für Entwicklungszwecke, an denen Sie sich hier anschließen können: https://discord.gg/nhg2jrn489
Um die Basis -Fitness -Bibliothek zu installieren, verwenden Sie pip install gym
.
Dies beinhaltet keine Abhängigkeiten für alle Familien von Umgebungen (es gibt eine massive Anzahl, und einige können problematisch auf bestimmten Systemen installieren). Sie können diese Abhängigkeiten für eine Familie wie pip install gym[atari]
installieren oder pip install gym[all]
verwenden, um alle Abhängigkeiten zu installieren.
Wir unterstützen Python 3.7, 3.8, 3,9 und 3.10 unter Linux und MacOS. Wir werden PRS im Zusammenhang mit Windows akzeptieren, aber sie nicht offiziell unterstützen.
Die API -API -Fitness -API -Umgebungen der Fitnessstudio -API als einfache Python env
-Klassen. Das Erstellen von Umgebungsinstanzen und die Interaktion mit ihnen ist sehr einfach- hier ist ein Beispiel mit der Umgebung "Cartpole-V1":
import gym
env = gym . make ( "CartPole-v1" )
observation , info = env . reset ( seed = 42 )
for _ in range ( 1000 ):
action = env . action_space . sample ()
observation , reward , terminated , truncated , info = env . step ( action )
if terminated or truncated :
observation , info = env . reset ()
env . close ()
Bitte beachten Sie, dass dies eine unvollständige Liste ist, und enthält nur Bibliotheken, auf die die Wartenden am häufigsten Newcommers verweisen, wenn sie nach Empfehlungen gefragt werden.
Fitnessstudio hält aus Reproduzierbarkeitsgründen strenge Versionen. Alle Umgebungen enden in einem Suffix wie "_v0". Wenn Änderungen in Umgebungen vorgenommen werden, die sich auf die Lernergebnisse auswirken könnten, wird die Zahl durch eins erhöht, um potenzielle Verwirrung zu verhindern.
Die neuesten "_v4" und zukünftigen Versionen der Mujoco-Umgebungen werden nicht mehr von mujoco-py
abhängen. Stattdessen wird mujoco
die erforderliche Abhängigkeit für zukünftige Fitnessstudio -Mujoco -Umgebungsversionen sein. Alte Fitnessstudio-Umweltversionen, die von mujoco-py
abhängen, werden immer noch gehalten, aber nicht gehört. Um die Abhängigkeiten für die neuesten Fitnessstudio -MUJOCO -Umgebungen zu installieren, verwenden Sie pip install gym[mujoco]
. Abhängigkeiten für alte Mujoco -Umgebungen können weiterhin von pip install gym[mujoco_py]
installiert werden.
Ein Whitepaper aus dem Zeitpunkt, an dem gerade gekommen ist, ist verfügbar https://arxiv.org/pdf/1606.01540 und kann mit dem folgenden Bibtex -Eintrag angeführt werden:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
Früher gab es hier veröffentlichte Notizen für alle neuen Fitnessversionen hier. Neue Versionshinweise werden wie die meisten anderen Bibliotheken auf die Releases -Seite auf Github verschoben. Alte Notizen können hier angezeigt werden.