open_spiel
OpenSpiel 1.5
OpenSpiel は、一般的な強化学習の研究とゲームにおける検索/計画のための環境とアルゴリズムのコレクションです。 OpenSpiel は、従来のマルチエージェント環境に加え、n プレイヤー (シングルおよびマルチエージェント) のゼロサム、協力および総和、ワンショットおよびシーケンシャル、厳密なターンテイキングおよび同時移動、完全および不完全情報ゲームをサポートします。 (部分的および完全に観察可能な)グリッド世界や社会的ジレンマなど。 OpenSpiel には、学習ダイナミクスやその他の一般的な評価指標を分析するツールも含まれています。ゲームは、いくつかの自然な拡張を備えた、手続き型の拡張形式のゲームとして表現されます。コア API とゲームは C++ で実装され、Python に公開されます。アルゴリズムとツールは C++ と Python の両方で記述されています。
Google Colaboratory で OpenSpiel を試すには、 open_spiel/colabs
サブディレクトリを参照するか、ここから開始してください。
次のオプションから選択してください。
アルゴリズムの概要といくつかの結果を含む、中心となる概念、形式、用語の詳細については、「OpenSpiel: ゲームにおける強化学習のためのフレームワーク」を参照してください。
OpenSpiel の概要とコア API の使用例については、チュートリアルをご覧ください。
研究で OpenSpiel を使用する場合は、次の BibTeX を使用して論文を引用してください。
@article { LanctotEtAl2019OpenSpiel ,
title = { {OpenSpiel}: A Framework for Reinforcement Learning in Games } ,
author = { Marc Lanctot and Edward Lockhart and Jean-Baptiste Lespiau and
Vinicius Zambaldi and Satyaki Upadhyay and Julien P'{e}rolat and
Sriram Srinivasan and Finbarr Timbers and Karl Tuyls and
Shayegan Omidshafiei and Daniel Hennes and Dustin Morrill and
Paul Muller and Timo Ewalds and Ryan Faulkner and J'{a}nos Kram'{a}r
and Bart De Vylder and Brennan Saeta and James Bradbury and David Ding
and Sebastian Borgeaud and Matthew Lai and Julian Schrittwieser and
Thomas Anthony and Edward Hughes and Ivo Danihelka and Jonah Ryan-Davis } ,
year = { 2019 } ,
eprint = { 1908.09453 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.LG } ,
journal = { CoRR } ,
volume = { abs/1908.09453 } ,
url = { http://arxiv.org/abs/1908.09453 } ,
}
セマンティック バージョニングを使用します。