Gym est une bibliothèque Python open source pour développer et comparer les algorithmes d'apprentissage de renforcement en fournissant une API standard pour communiquer entre les algorithmes d'apprentissage et les environnements, ainsi qu'un ensemble standard d'environnements conformes à cette API. Depuis sa sortie, l'API de Gym est devenue la norme sur le terrain pour ce faire.
Le site Web de documentation de gym est sur https://www.gymlibrary.dev/, et vous pouvez proposer des correctifs et des modifications ici.
Le gymnase a également un serveur Discord à des fins de développement que vous pouvez rejoindre ici: https://discord.gg/nhg2jrn489
Pour installer la bibliothèque de Gym de base, utilisez pip install gym
.
Cela n'inclut pas les dépendances pour toutes les familles d'environnements (il existe un nombre massif, et certains peuvent être problématiques à installer sur certains systèmes). Vous pouvez installer ces dépendances pour une famille comme pip install gym[atari]
ou utiliser pip install gym[all]
pour installer toutes les dépendances.
Nous prenons en charge Python 3.7, 3.8, 3,9 et 3.10 sur Linux et MacOS. Nous accepterons PRS liés à Windows, mais ne le soutenons pas officiellement.
L'API de l'API de gym modélise les environnements comme simples Python env
. Créer des instances d'environnement et interagir avec eux est très simple - voici un exemple utilisant l'environnement "Cartpole-V1":
import gym
env = gym . make ( "CartPole-v1" )
observation , info = env . reset ( seed = 42 )
for _ in range ( 1000 ):
action = env . action_space . sample ()
observation , reward , terminated , truncated , info = env . step ( action )
if terminated or truncated :
observation , info = env . reset ()
env . close ()
Veuillez noter qu'il s'agit d'une liste incomplète et inclut simplement les bibliothèques que les mainteneurs pointent le plus souvent les nouveaux recommandés lorsqu'on leur demande des recommandations.
Le gymnase maintient des versions strictes pour des raisons de reproductibilité. Tous les environnements se terminent par un suffixe comme "_v0". Lorsque des modifications sont apportées aux environnements qui pourraient avoir un impact sur les résultats de l'apprentissage, le nombre est augmenté de celui pour éviter une confusion potentielle.
Les dernières versions "_v4" et futures des environnements Mujoco ne dépendront plus de mujoco-py
. Au lieu de cela, mujoco
sera la dépendance requise pour les futures versions de Gym Mujoco Environment. Old gym Mujoco Environment les versions qui dépendent de mujoco-py
seront toujours conservées mais non entretenues. Pour installer les dépendances des derniers environnements de gymnas Mujoco, utilisez pip install gym[mujoco]
. Les dépendances pour les anciens environnements Mujoco peuvent toujours être installés par pip install gym[mujoco_py]
.
Un livre blanc de When Gym vient de sortir est disponible https://arxiv.org/pdf/1606.01540, et peut être cité avec l'entrée Bibtex suivante:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
Il y avait des notes de sortie pour toutes les nouvelles versions de gym ici. De nouvelles notes de version sont déplacées vers la page des versions sur GitHub, comme la plupart des autres bibliothèques. Les vieilles notes peuvent être consultées ici.