Gym是一个开源Python库,用于通过提供标准API来开发和比较增强学习算法,以在学习算法和环境之间进行通信,以及符合该API的标准环境。自发行以来,健身房的API已成为这样做的现场标准。
Gym Documentation网站位于https://www.gymlibrary.dev/,您可以在此处提出修复和更改。
健身房还具有用于开发目的的Discord服务器,您可以在此处加入:https://discord.gg/nhg2jrn489
要安装基础健身房库,请使用pip install gym
。
这并不包括所有环境家庭的依赖关系(数量有很多,有些可能会在某些系统上安装)。您可以为一个家庭安装这些依赖项,例如pip install gym[atari]
,也可以使用pip install gym[all]
安装所有依赖项。
我们支持Linux和MacOS上的Python 3.7、3.8、3.9和3.10。我们将接受与Windows相关的PR,但不正式支持它。
体育馆API的API将环境建模为简单的Python env
类。创建环境实例并与它们进行互动非常简单 - 这是使用“ Cartpole-V1”环境的示例:
import gym
env = gym . make ( "CartPole-v1" )
observation , info = env . reset ( seed = 42 )
for _ in range ( 1000 ):
action = env . action_space . sample ()
observation , reward , terminated , truncated , info = env . step ( action )
if terminated or truncated :
observation , info = env . reset ()
env . close ()
请注意,这是一个不完整的列表,只包括维护者在被要求提出建议时最常见的新闻。
出于可重复性原因,健身房保留严格的版本控制。所有环境以“ _v0”之类的后缀结束。当对可能影响学习结果的环境进行更改时,数量会增加一个,以防止潜在的混乱。
Mujoco环境的最新“ _V4”和未来版本将不再取决于mujoco-py
。相反, mujoco
将是未来体育馆Mujoco环境版本所需的依赖性。依mujoco-py
的旧体育馆Mujoco环境版本仍将保留,但仍不是不受欢迎的。为了安装最新健身房环境的依赖项,请使用pip install gym[mujoco]
。旧的Mujoco环境的依赖项仍然可以通过pip install gym[mujoco_py]
安装。
当健身房出来时的白皮书https://arxiv.org/pdf/1606.01540,可以用以下Bibtex输入来引用:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
这里曾经有所有新的健身房版本的发行说明。与大多数其他库一样,新的发行说明正在移至GitHub上的发行页面。可以在这里查看旧音符。