مجموعة من محاكيات الألعاب المتوازية المسرَّعة بواسطة وحدة معالجة الرسومات للتعلم المعزز (RL)
ملحوظة
إذا وجدت هذا المشروع مفيدًا، فسنكون ممتنين لدعمك من خلال أحد نجوم GitHub لمساعدتنا على تنمية المجتمع وتحفيز المزيد من التطوير!
v1
"tic_tac_toe"
v0
يتم إصدار كل بيئة، ويتم زيادة الإصدار عندما تكون هناك تغييرات تؤثر على أداء الوكلاء أو عندما تكون هناك تغييرات غير متوافقة مع واجهة برمجة التطبيقات (API). إذا كنت ترغب في متابعة التكرار الكامل، فنوصيك بالتحقق من إصدار Pgx وكل بيئة على النحو التالي:
> >> pgx . __version__
'1.0.0'
> >> env . version
'v0'
تم تصميم Pgx لتكملة بيئات JAX الأصلية ببدلات ألعاب اللوحة (الكلاسيكية):
قد يكون الجمع بين Pgx وخوارزميات/تطبيقات JAX الأصلية اتجاهًا مثيرًا للاهتمام:
في الوقت الحالي، لا تعمل بعض البيئات، بما في ذلك Go وchess، بشكل جيد على وحدات TPU. الرجاء استخدام وحدات معالجة الرسومات بدلاً من ذلك.
إذا كنت تستخدم Pgx في عملك، فيرجى الاستشهاد بمقالتنا:
@inproceedings{koyamada2023pgx,
title={Pgx: Hardware-Accelerated Parallel Game Simulators for Reinforcement Learning},
author={Koyamada, Sotetsu and Okano, Shinri and Nishimori, Soichiro and Murata, Yu and Habara, Keigo and Kita, Haruka and Ishii, Shin},
booktitle={Advances in Neural Information Processing Systems},
pages={45716--45743},
volume={36},
year={2023}
}
أباتشي-2.0