pgx 다운로드 - pgx 소스 코드 다운로드

pgx

AI 소스 코드

v2.5.0

다운로드

강화 학습(RL)을 위한 GPU 가속 병렬 게임 시뮬레이터 컬렉션

메모

이 프로젝트가 도움이 된다면 GitHub 스타를 통해 커뮤니티를 성장시키고 추가 개발에 동기를 부여하는 데 도움을 주시면 감사하겠습니다!

v1 단순화되고 어린이 친화적인 마작입니다. 틱택토
"tic_tac_toe" v0 3연속 승리.

버전 관리 정책

각 환경에는 버전이 지정되며 에이전트 성능에 영향을 미치는 변경 사항이 있거나 API와 이전 버전과 호환되지 않는 변경 사항이 있는 경우 버전이 증가합니다. 완전한 재현성을 추구하려면 다음과 같이 Pgx 버전과 각 환경을 확인하는 것이 좋습니다.

 > >> pgx . __version__
'1.0.0'
> >> env . version
'v0'

또한보십시오

Pgx는 이러한 JAX 기본 환경을 (클래식) 보드 게임 슈트로 보완하기 위해 고안되었습니다.

RobertTLange/gymnax: 널리 사용되는 RL 환경(클래식 컨트롤, bsuite, MinAtar 등) 및 메타 RL 작업의 JAX 구현
google/brax: JAX 및 연속 공간 RL 작업(ant, fetch, humanoid 등)의 강체 물리 시뮬레이션
instadeepai/jumanji: JAX의 다양하고 까다로운 RL 환경 제품군(빈 패킹, 라우팅 문제 등)
flairox/jaxmarl: JAX의 다중 에이전트 RL 환경(간소화된 StarCraft 등)
corl-team/xland-minigrid: MiniGrid 및 XLand에서 영감을 받은 JAX의 Meta-RL 그리드월드 환경
MichaelTMatthews/Craftax: 개방형 RL을 위한 JAX의 (Crafter + NetHack)
Epignatelli/navix: JAX에서 MiniGrid 재구현

Pgx를 이러한 JAX 기반 알고리즘/구현 과 결합하는 것은 흥미로운 방향이 될 수 있습니다.

Anakin 프레임워크: TPU의 JAX 기본 환경에서 작동하는 매우 효율적인 RL 프레임워크
deepmind/mctx: AlphaZero 및 MuZero를 포함한 JAX 기반 MCTS 구현
deepmind/rlax: JAX 기반 RL 구성요소
google/evojax: 하드웨어 가속 신경 진화
RobertTLange/evosax: JAX 기반 ES(진화 전략) 구현
adaptive-intelligent-robotics/QDax: JAX 기반 QD(품질 다양성) 알고리즘
luchris429/purejaxrl: Jax 기반 RL 구현

한정

현재 바둑, 체스 등 일부 환경은 TPU에서 제대로 작동하지 않습니다. 대신 GPU를 사용하세요.

소환

업무에 Pgx를 사용하는 경우 당사 논문을 인용해 주세요.

 @inproceedings{koyamada2023pgx,
  title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
  author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
  booktitle={Advances in Neural Information Processing Systems},
  pages={45716--45743},
  volume={36},
  year={2023}
}