open_spiel
OpenSpiel 1.5
OpenSpiel 是用來研究一般強化學習和遊戲中搜尋/規劃的環境和演算法的集合。 OpenSpiel支援n人(單智能體和多智能體)零和、合作和一般和、單發和順序、嚴格輪流和同時移動、完美和不完美信息博弈以及傳統的多智能體環境例如(部分和完全可觀察的)網格世界和社會困境。 OpenSpiel 還包括用於分析學習動態和其他常見評估指標的工具。遊戲被表示為程序性的擴展形式的遊戲,具有一些自然的擴展。核心 API 和遊戲用 C++ 實作並暴露給 Python。演算法和工具都是用 C++ 和 Python 寫的。
若要在 Google Colaboratory 中試用 OpenSpiel,請參閱open_spiel/colabs
子目錄或從這裡開始。
請選擇以下選項:
有關核心概念、形式和術語的詳細介紹,包括演算法概述和一些結果,請參閱 OpenSpiel:遊戲中強化學習的框架。
有關 OpenSpiel 的概述以及核心 API 的範例使用,請查看我們的教學課程:
如果您在研究中使用 OpenSpiel,請使用以下 BibTeX 引用論文:
@article { LanctotEtAl2019OpenSpiel ,
title = { {OpenSpiel}: A Framework for Reinforcement Learning in Games } ,
author = { Marc Lanctot and Edward Lockhart and Jean-Baptiste Lespiau and
Vinicius Zambaldi and Satyaki Upadhyay and Julien P'{e}rolat and
Sriram Srinivasan and Finbarr Timbers and Karl Tuyls and
Shayegan Omidshafiei and Daniel Hennes and Dustin Morrill and
Paul Muller and Timo Ewalds and Ryan Faulkner and J'{a}nos Kram'{a}r
and Bart De Vylder and Brennan Saeta and James Bradbury and David Ding
and Sebastian Borgeaud and Matthew Lai and Julian Schrittwieser and
Thomas Anthony and Edward Hughes and Ivo Danihelka and Jonah Ryan-Davis } ,
year = { 2019 } ,
eprint = { 1908.09453 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.LG } ,
journal = { CoRR } ,
volume = { abs/1908.09453 } ,
url = { http://arxiv.org/abs/1908.09453 } ,
}
我們使用語義版本控制。