Ce sont les codes originaux (2020) utilisés pour le papier
POMO : optimisation des politiques avec plusieurs Optima pour l'apprentissage par renforcement
accepté à NeurIPS 2020
http://arxiv.org/abs/2010.16011 https://proceedings.neurips.cc/paper/2020/hash/f231f2107df69eab0a3862d50018a9b2-Abstract.html
Ils sont basés sur des fichiers ipynb et sont plus faciles à jouer de manière interactive.
Ce sont les codes mis à jour, nouvellement structurés en 2021.
Ils sont basés sur des fichiers py, afin de pouvoir être exécutés plus facilement sur des serveurs.