genrl
v0.0.2
GenRL是一个Pytorch增强学习库,围绕可再现,可概括的算法实现并改善强化学习的可访问性
GenRL的当前版本为v0.0.2。期望破裂的变化
强化学习研究的移动速度比以往任何时候都更快。为了跟上不断增长的趋势并确保RL研究保持可再现,GenRL旨在通过提供以下主要特征来帮助更快的纸张再现和基准测试:
通过将这些功能集成到GenRL中,我们旨在最终支持少于100行的任何新算法实现。
如果您有兴趣做出贡献,请随时解决问题,文档,测试等。如果有任何问题,请查看贡献指南
GenRL与Python 3.6或更高版本兼容,也取决于pytorch
和openai-gym
。安装GenRL的最简单方法是使用Python的首选软件包安装程序PIP。
$ pip install genrl
请注意,GenRL是一个活跃的项目,通常会发布新的版本。为了将GenRL升级到最新版本,请使用如下使用PIP。
$ pip install -U genrl
如果您打算安装最新的未发布版本的库(即来自来源),则可以简单地做:
$ git clone https://github.com/SforAiDl/genrl.git
$ cd genrl
$ python setup.py install
在Pendulum-v0
健身房环境中从头开始训练柔软的演员批判性模型,并在张板上登录奖励
import gym
from genrl . agents import SAC
from genrl . trainers import OffPolicyTrainer
from genrl . environments import VectorEnv
env = VectorEnv ( "Pendulum-v0" )
agent = SAC ( 'mlp' , env )
trainer = OffPolicyTrainer ( agent , env , log_mode = [ 'stdout' , 'tensorboard' ])
trainer . train ()
在FrozenLake-v0
健身房环境中从头开始训练表格dyna-Q模型,并进行奖励:
import gym
from genrl . agents import QLearning
from genrl . trainers import ClassicalTrainer
env = gym . make ( "FrozenLake-v0" )
agent = QLearning ( env )
trainer = ClassicalTrainer ( agent , env , mode = "dyna" , model = "tabular" , n_episodes = 10000 )
episode_rewards = trainer . train ()
trainer . plot ( episode_rewards )