Коллекция симуляторов параллельных игр с графическим ускорением для обучения с подкреплением (RL).
Примечание
Если вы найдете этот проект полезным, мы будем благодарны за вашу поддержку через звезду GitHub, которая поможет нам расширить сообщество и мотивировать дальнейшее развитие!
v1
"tic_tac_toe"
v0
Каждая среда имеет версию, и версия увеличивается при наличии изменений, влияющих на производительность агентов, или при наличии изменений, которые не имеют обратной совместимости с API. Если вы хотите добиться полной воспроизводимости, мы рекомендуем вам проверить версию Pgx и каждую среду следующим образом:
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx предназначен для дополнения этих JAX-родных сред (классическими) наборами для настольных игр:
Объединение Pgx с этими собственными алгоритмами/реализациями JAX может быть интересным направлением:
В настоящее время некоторые среды, включая го и шахматы, не очень хорошо работают на TPU. Вместо этого используйте графические процессоры.
Если вы используете Pgx в своей работе, пожалуйста, цитируйте нашу статью:
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
Апач-2.0