pgx下載 - pgx原始碼下載

pgx

Ai源碼

v2.5.0

下載

用於強化學習 (RL) 的 GPU 加速平行遊戲模擬器集合

筆記

如果您覺得這個專案有幫助，我們將非常感謝您透過 GitHub 之星提供的支持，以幫助我們發展社區並激勵進一步的發展！

v1簡化的、適合兒童的麻將。井字遊戲
"tic_tac_toe" v0三連勝。

版本控制政策

每個環境都有版本控制，當存在影響代理效能的變更或存在與 API 不向後相容的變更時，版本會遞增。如果您想追求完整的重現性，我們建議您如下檢查Pgx的版本和各個環境：

 > >> pgx . __version__
'1.0.0'
> >> env . version
'v0'

參見

Pgx 旨在透過（經典）棋盤遊戲套裝來補充這些JAX 原生環境：

RobertTLange/gymnax：流行 RL 環境（經典控制、bsuite、MinAtar 等）和元 RL 任務的 JAX 實現
google/brax：JAX 與連續空間 RL 任務（ant、fetch、人形機器人等）中的剛體物理模擬
instadeepai/jumanji：JAX 中的一套多樣化且具有挑戰性的 RL 環境（裝箱、路由問題等）
flairox/jaxmarl：JAX 中的多代理 RL 環境（簡化的星海爭霸等）
corl-team/xland-minigrid：JAX 中的 Meta-RL 網格世界環境，靈感來自 MiniGrid 和 XLand
MichaelTMatthews/Craftax：（Crafter + NetHack）在 JAX 中用於開放式強化學習
epignatelli/navix：在 JAX 中重新實作 MiniGrid

將 Pgx 與這些JAX 原生演算法/實作結合可能是一個有趣的方向：

Anakin 框架：高效率的 RL 框架，可與 TPU 上的 JAX 本機環境搭配使用
deepmind/mctx：JAX 原生 MCTS 實現，包括 AlphaZero 和 MuZero
deepmind/rlax：JAX 原生 RL 組件
google/evojax：硬體加速神經進化
RobertTLange/evosax：JAX 原生演化策略 (ES) 實現
自適應智慧機器人/QDax：JAX 原生品質多樣性 (QD) 演算法
luchris429/purejaxrl：Jax 原生 RL 實現

限制

目前，包括圍棋和西洋棋在內的一些環境在 TPU 上表現不佳。請改用 GPU。

引文

如果您在工作中使用 Pgx，請引用我們的論文：

 @inproceedings{koyamada2023pgx,
  title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
  author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
  booktitle={Advances in Neural Information Processing Systems},
  pages={45716--45743},
  volume={36},
  year={2023}
}