파이썬 3
OpenAI 체육관 0.11.0
파이토치
딥 그래프 라이브러리 (https://www.dgl.ai/)
이 문서에 사용된 작업을 더 잘 이해하려면Tasks_video.mp4에서 짧은 비디오를 찾아보십시오.
main/results/ 폴더에서 모든 작업에 대해 사전 훈련된 모델을 찾을 수 있습니다.
random_cross 작업 -> 메인/결과/model_random_cross/
random_grid 작업 -> 메인/결과/model_random_grid/
unlabeled_goals 작업 -> 메인/결과/model_unlabeled/
그림 1의 two_groups_cross -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
위의 cmd는 main/results/RESULT_DIR/plots/에 플롯을 생성해야 합니다.
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR은 model_random_cross, model_random_grid, model_unlabeled, model_2groups_cross일 수 있습니다.
BASELINE은 tf-full, hard, dist, prog, prog-retrained, dt, dt-retrained, det, det-retrained일 수 있습니다.
prog-retrained는 우리의 전체 접근 방식에 해당하는 버전입니다.
모델을 처음부터 학습하려면 다음 스크립트를 실행하세요. (이 부분은 몇 시간이 걸리고 GPU가 필요하다는 점을 참고하세요)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh