humanoid run ppo
1.0.0
Code pour l'article "Apprendre des compétences en robot humanoïde grâce à l'optimisation de la politique proximale"
Dans ce référentiel, nous publions le code de l'agent d'apprentissage pour donner des détails sur notre MDP et notre procédure de formation. Si vous souhaitez vérifier les journaux, les photos, les vidéos et les résultats, nous nous référons à: http://tiny.cc/vzc5cz
Si vous utilisez ce travail, veuillez citer le papier.