Kumpulan simulator game paralel dengan akselerasi GPU untuk pembelajaran penguatan (RL)
Catatan
Jika menurut Anda proyek ini bermanfaat, kami akan berterima kasih atas dukungan Anda melalui bintang GitHub untuk membantu kami mengembangkan komunitas dan memotivasi pengembangan lebih lanjut!
v1
"tic_tac_toe"
v0
Setiap lingkungan diberi versi, dan versi tersebut bertambah ketika ada perubahan yang memengaruhi kinerja agen atau ketika ada perubahan yang tidak kompatibel dengan API. Jika Anda ingin mencapai reproduktifitas penuh, kami menyarankan Anda memeriksa versi Pgx dan setiap lingkungan sebagai berikut:
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx dimaksudkan untuk melengkapi lingkungan asli JAX ini dengan setelan permainan papan (klasik):
Menggabungkan Pgx dengan algoritme/implementasi asli JAX berikut mungkin merupakan arah yang menarik:
Saat ini, beberapa lingkungan, termasuk Go dan catur, tidak berfungsi dengan baik di TPU. Silakan gunakan GPU sebagai gantinya.
Jika Anda menggunakan Pgx dalam karya Anda, silakan kutip makalah kami:
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
Apache-2.0