humanoid run ppo
1.0.0
논문 코드 "근위 정책 최적화를 통한 인간형 로봇 실행 기술 학습"
이 저장소에서는 MDP 및 교육 절차에 대한 세부 정보를 제공하기 위해 학습 에이전트 코드를 발표합니다. 로그, 사진, 비디오 및 결과를 확인하려면 다음을 참조하십시오. http://tiny.cc/vzc5cz
이 작업을 사용하는 경우 종이를 인용하십시오.