OpenSpiel — это набор сред и алгоритмов для исследований в области общего обучения с подкреплением и поиска/планирования в играх. OpenSpiel поддерживает многопользовательские (одно- и многоагентные) игры с нулевой суммой, кооперативные и с общей суммой, одноразовые и последовательные, строго очередные и одновременные, совершенные и несовершенные информационные игры, а также традиционные многоагентные среды. такие как (частично и полностью наблюдаемые) сетчатые миры и социальные дилеммы. OpenSpiel также включает инструменты для анализа динамики обучения и других общих показателей оценки. Игры представлены как процедурные игры развернутой формы с некоторыми естественными расширениями. Основной API и игры реализованы на C++ и доступны для Python. Алгоритмы и инструменты написаны как на C++, так и на Python.
Чтобы попробовать OpenSpiel в Google Colaboratory, перейдите в подкаталог open_spiel/colabs
или начните здесь.
Пожалуйста, выберите один из следующих вариантов:
Более подробное введение в основные концепции, формализмы и терминологию, включая обзор алгоритмов и некоторые результаты, можно найти в статье OpenSpiel: Структура обучения с подкреплением в играх.
Обзор OpenSpiel и примеры использования основного API можно найти в наших руководствах:
Если вы используете OpenSpiel в своих исследованиях, цитируйте статью, используя следующий BibTeX:
@article { LanctotEtAl2019OpenSpiel ,
title = { {OpenSpiel}: A Framework for Reinforcement Learning in Games } ,
author = { Marc Lanctot and Edward Lockhart and Jean-Baptiste Lespiau and
Vinicius Zambaldi and Satyaki Upadhyay and Julien P'{e}rolat and
Sriram Srinivasan and Finbarr Timbers and Karl Tuyls and
Shayegan Omidshafiei and Daniel Hennes and Dustin Morrill and
Paul Muller and Timo Ewalds and Ryan Faulkner and J'{a}nos Kram'{a}r
and Bart De Vylder and Brennan Saeta and James Bradbury and David Ding
and Sebastian Borgeaud and Matthew Lai and Julian Schrittwieser and
Thomas Anthony and Edward Hughes and Ivo Danihelka and Jonah Ryan-Davis } ,
year = { 2019 } ,
eprint = { 1908.09453 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.LG } ,
journal = { CoRR } ,
volume = { abs/1908.09453 } ,
url = { http://arxiv.org/abs/1908.09453 } ,
}
Мы используем семантическое управление версиями.