humanoid run ppo
1.0.0
論文のコード「近位のポリシーの最適化によるヒューマノイドロボットランニングスキル」の学習」
このリポジトリでは、学習エージェントのコードをリリースして、MDPとトレーニング手順に関する詳細を示します。ログ、写真、ビデオ、結果を確認したい場合は、http://tiny.cc/vzc5czを参照してください。
この作品を使用する場合は、論文を引用してください。