humanoid run ppo
1.0.0
Код для статьи «Изучение навыков работы гуманоидного робота посредством оптимизации проксимальной политики»
В этом репозитории мы выпускаем код учебного агента, чтобы сообщить подробности о нашей MDP и процедуре обучения. Если вы хотите проверить журналы, фотографии, видео и результаты, мы ссылаемся на: http://tiny.cc/vzc5cz
Если вы используете эту работу, пожалуйста, процитируйте бумагу.