O Gym é uma biblioteca Python de código aberto para desenvolver e comparar algoritmos de aprendizado de reforço, fornecendo uma API padrão para se comunicar entre algoritmos e ambientes de aprendizagem, bem como um conjunto padrão de ambientes em conformidade com essa API. Desde o seu lançamento, a API da academia se tornou o padrão de campo para fazer isso.
O site de documentação da academia está em https://www.gymlibrary.dev/, e você pode propor correções e alterações aqui.
O Gym também possui um servidor Discord para fins de desenvolvimento que você pode participar aqui: https://discord.gg/nhg2jrn489
Para instalar a biblioteca de ginástica base, use pip install gym
.
Isso não inclui dependências para todas as famílias de ambientes (há um número massivo e algumas podem ser problemáticas para instalar em determinados sistemas). Você pode instalar essas dependências para uma família como pip install gym[atari]
ou usar pip install gym[all]
para instalar todas as dependências.
Apoiamos o Python 3.7, 3,8, 3,9 e 3,10 no Linux e MacOS. Aceitaremos os PRs relacionados ao Windows, mas não o apoiaremos oficialmente.
O API da API da academia modela ambientes como simples classes Python env
. Criar instâncias do ambiente e interagir com eles é muito simples: aqui está um exemplo usando o ambiente "Cartpole-V1":
import gym
env = gym . make ( "CartPole-v1" )
observation , info = env . reset ( seed = 42 )
for _ in range ( 1000 ):
action = env . action_space . sample ()
observation , reward , terminated , truncated , info = env . step ( action )
if terminated or truncated :
observation , info = env . reset ()
env . close ()
Observe que esta é uma lista incompleta e inclui apenas as bibliotecas que os mantenedores geralmente apontam para os novos comércio quando solicitados recomendações.
A academia mantém a versão rigorosa por razões de reprodutibilidade. Todos os ambientes terminam em um sufixo como "_v0". Quando são feitas alterações em ambientes que podem afetar os resultados da aprendizagem, o número é aumentado por um para evitar possíveis confusão.
As mais recentes versões "_v4" e futuras dos ambientes Mujoco não dependerão mais do mujoco-py
. Em vez disso, mujoco
será a dependência necessária para futuras versões do meio ambiente da academia. As versões do meio ambiente do Old Gym Mujoco que dependem do mujoco-py
ainda serão mantidas, mas sem manutenção. Para instalar as dependências para os ambientes mais recentes da academia Mujoco, use pip install gym[mujoco]
. As dependências para ambientes mujoco antigos ainda podem ser instalados pelo pip install gym[mujoco_py]
.
Um white paper de quando o ginásio acabou de sair está disponível https://arxiv.org/pdf/1606.01540 e pode ser citado com a seguinte entrada BibTex:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
Costumava haver notas de lançamento para todas as novas versões da academia aqui. Novas notas de lançamento estão sendo transferidas para a página de lançamentos no Github, como a maioria das outras bibliotecas. Notas antigas podem ser vistas aqui.