pgx
v2.5.0
強化学習 (RL) 用の GPU アクセラレーションによる並列ゲーム シミュレーターのコレクション
注記
このプロジェクトが役立つと思われた場合は、コミュニティを成長させ、さらなる開発の動機付けを支援するために、GitHub スターを通じてサポートしていただければ幸いです。
v1
"tic_tac_toe"
v0
各環境はバージョン管理されており、エージェントのパフォーマンスに影響を与える変更がある場合、または API との下位互換性のない変更がある場合、バージョンが増分されます。完全な再現性を追求したい場合は、以下のようにPgxのバージョンや各環境を確認することをお勧めします。
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx は、これらのJAX ネイティブ環境を(クラシックな) ボード ゲーム スーツで補完することを目的としています。
Pgx をこれらのJAX ネイティブのアルゴリズム/実装と組み合わせるのは、興味深い方向性かもしれません。
現在、囲碁やチェスなどの一部の環境は、TPU では適切なパフォーマンスを発揮しません。代わりに GPU を使用してください。
仕事で Pgx を使用している場合は、私たちの論文を引用してください。
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
アパッチ-2.0