pgx
v2.5.0
用於強化學習 (RL) 的 GPU 加速平行遊戲模擬器集合
筆記
如果您覺得這個專案有幫助,我們將非常感謝您透過 GitHub 之星提供的支持,以幫助我們發展社區並激勵進一步的發展!
v1
"tic_tac_toe"
v0
每個環境都有版本控制,當存在影響代理效能的變更或存在與 API 不向後相容的變更時,版本會遞增。如果您想追求完整的重現性,我們建議您如下檢查Pgx的版本和各個環境:
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx 旨在透過(經典)棋盤遊戲套裝來補充這些JAX 原生環境:
將 Pgx 與這些JAX 原生演算法/實作結合可能是一個有趣的方向:
目前,包括圍棋和西洋棋在內的一些環境在 TPU 上表現不佳。請改用 GPU。
如果您在工作中使用 Pgx,請引用我們的論文:
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
阿帕契-2.0