OpenSpiel est une collection d'environnements et d'algorithmes pour la recherche en apprentissage général par renforcement et la recherche/planification dans les jeux. OpenSpiel prend en charge les jeux à somme nulle, coopératifs et à somme générale, à un coup et séquentiels, strictement à tour de rôle et à mouvements simultanés, à somme nulle, à n joueurs (mono-agent et multi-agents), ainsi que les environnements multi-agents traditionnels. tels que les mondes en grille (partiellement et entièrement observables) et les dilemmes sociaux. OpenSpiel comprend également des outils pour analyser la dynamique d'apprentissage et d'autres mesures d'évaluation courantes. Les jeux sont représentés comme des jeux procéduraux de forme étendue, avec quelques extensions naturelles. L'API de base et les jeux sont implémentés en C++ et exposés à Python. Les algorithmes et les outils sont écrits à la fois en C++ et en Python.
Pour essayer OpenSpiel dans Google Colaboratory, veuillez vous référer au sous-répertoire open_spiel/colabs
ou commencer ici.
Veuillez choisir parmi les options suivantes :
Pour une introduction plus longue aux concepts de base, aux formalismes et à la terminologie, y compris un aperçu des algorithmes et quelques résultats, veuillez consulter OpenSpiel : Un cadre pour l'apprentissage par renforcement dans les jeux.
Pour un aperçu d'OpenSpiel et des exemples d'utilisation de l'API principale, veuillez consulter nos tutoriels :
Si vous utilisez OpenSpiel dans votre recherche, veuillez citer l'article en utilisant le BibTeX suivant :
@article { LanctotEtAl2019OpenSpiel ,
title = { {OpenSpiel}: A Framework for Reinforcement Learning in Games } ,
author = { Marc Lanctot and Edward Lockhart and Jean-Baptiste Lespiau and
Vinicius Zambaldi and Satyaki Upadhyay and Julien P'{e}rolat and
Sriram Srinivasan and Finbarr Timbers and Karl Tuyls and
Shayegan Omidshafiei and Daniel Hennes and Dustin Morrill and
Paul Muller and Timo Ewalds and Ryan Faulkner and J'{a}nos Kram'{a}r
and Bart De Vylder and Brennan Saeta and James Bradbury and David Ding
and Sebastian Borgeaud and Matthew Lai and Julian Schrittwieser and
Thomas Anthony and Edward Hughes and Ivo Danihelka and Jonah Ryan-Davis } ,
year = { 2019 } ,
eprint = { 1908.09453 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.LG } ,
journal = { CoRR } ,
volume = { abs/1908.09453 } ,
url = { http://arxiv.org/abs/1908.09453 } ,
}
Nous utilisons le versioning sémantique.