蟒蛇3
OpenAI健身房0.11.0
火炬
深度圖庫(https://www.dgl.ai/)
請在tasks_video.mp4 中找到一個簡短的視頻,以更好地了解本文中使用的任務。
您可以在 main/results/ 資料夾中找到所有任務的預訓練模型。
random_cross 任務 -> main/results/model_random_cross/
random_grid 任務 -> main/results/model_random_grid/
unlabeled_goals 任務 -> main/results/model_unlabeled/
圖 1 中的two_groups_cross -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
上述指令應在 main/results/RESULT_DIR/plots/ 處建立繪圖
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR 可以是 model_random_cross、model_random_grid、model_unlabeled、model_2groups_cross。
BASELINE 可以是 tf-full、hard、dist、prog、prog-retrained、dt、dt-retrained、det、det-retrained。
請注意,prog-retrained 是與我們的完整方法相對應的版本。
若要從頭開始訓練模型,請執行以下腳本。 (請注意,這部分需要幾個小時並且需要 GPU)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh