pgx
v2.5.0
강화 학습(RL)을 위한 GPU 가속 병렬 게임 시뮬레이터 컬렉션
메모
이 프로젝트가 도움이 된다면 GitHub 스타를 통해 커뮤니티를 성장시키고 추가 개발에 동기를 부여하는 데 도움을 주시면 감사하겠습니다!
v1
"tic_tac_toe"
v0
각 환경에는 버전이 지정되며 에이전트 성능에 영향을 미치는 변경 사항이 있거나 API와 이전 버전과 호환되지 않는 변경 사항이 있는 경우 버전이 증가합니다. 완전한 재현성을 추구하려면 다음과 같이 Pgx 버전과 각 환경을 확인하는 것이 좋습니다.
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
Pgx는 이러한 JAX 기본 환경을 (클래식) 보드 게임 슈트로 보완하기 위해 고안되었습니다.
Pgx를 이러한 JAX 기반 알고리즘/구현 과 결합하는 것은 흥미로운 방향이 될 수 있습니다.
현재 바둑, 체스 등 일부 환경은 TPU에서 제대로 작동하지 않습니다. 대신 GPU를 사용하세요.
업무에 Pgx를 사용하는 경우 당사 논문을 인용해 주세요.
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
아파치-2.0