Una colección de simuladores de juegos paralelos acelerados por GPU para aprendizaje por refuerzo (RL)
Nota
Si encuentra útil este proyecto, le agradeceríamos su apoyo a través de una estrella de GitHub para ayudarnos a hacer crecer la comunidad y motivar un mayor desarrollo.
v1
"tic_tac_toe"
v0
Cada entorno tiene una versión y la versión se incrementa cuando hay cambios que afectan el rendimiento de los agentes o cuando hay cambios que no son compatibles con la API. Si desea lograr una reproducibilidad completa, le recomendamos que verifique la versión de Pgx y cada entorno de la siguiente manera:
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx pretende complementar estos entornos nativos de JAX con trajes de juegos de mesa (clásicos):
Combinar Pgx con estos algoritmos/implementaciones nativas de JAX podría ser una dirección interesante:
Actualmente, algunos entornos, incluidos el Go y el ajedrez, no funcionan bien en TPU. Utilice GPU en su lugar.
Si utiliza Pgx en su trabajo, cite nuestro artículo:
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
Apache-2.0