open_spiel
OpenSpiel 1.5
OpenSpiel 是用于研究一般强化学习和游戏中搜索/规划的环境和算法的集合。 OpenSpiel 支持 n 人(单智能体和多智能体)零和、合作和一般和、单发和顺序、严格轮流和同时移动、完美和不完美信息博弈以及传统的多智能体环境例如(部分和完全可观察的)网格世界和社会困境。 OpenSpiel 还包括用于分析学习动态和其他常见评估指标的工具。游戏被表示为程序性的扩展形式的游戏,具有一些自然的扩展。核心 API 和游戏用 C++ 实现并暴露给 Python。算法和工具都是用 C++ 和 Python 编写的。
要在 Google Colaboratory 中试用 OpenSpiel,请参阅open_spiel/colabs
子目录或从这里开始。
请选择以下选项:
有关核心概念、形式和术语的详细介绍,包括算法概述和一些结果,请参阅 OpenSpiel:游戏中强化学习的框架。
有关 OpenSpiel 的概述以及核心 API 的示例使用,请查看我们的教程:
如果您在研究中使用 OpenSpiel,请使用以下 BibTeX 引用论文:
@article { LanctotEtAl2019OpenSpiel ,
title = { {OpenSpiel}: A Framework for Reinforcement Learning in Games } ,
author = { Marc Lanctot and Edward Lockhart and Jean-Baptiste Lespiau and
Vinicius Zambaldi and Satyaki Upadhyay and Julien P'{e}rolat and
Sriram Srinivasan and Finbarr Timbers and Karl Tuyls and
Shayegan Omidshafiei and Daniel Hennes and Dustin Morrill and
Paul Muller and Timo Ewalds and Ryan Faulkner and J'{a}nos Kram'{a}r
and Bart De Vylder and Brennan Saeta and James Bradbury and David Ding
and Sebastian Borgeaud and Matthew Lai and Julian Schrittwieser and
Thomas Anthony and Edward Hughes and Ivo Danihelka and Jonah Ryan-Davis } ,
year = { 2019 } ,
eprint = { 1908.09453 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.LG } ,
journal = { CoRR } ,
volume = { abs/1908.09453 } ,
url = { http://arxiv.org/abs/1908.09453 } ,
}
我们使用语义版本控制。