パイソン3
OpenAIジム0.11.0
パイトーチ
ディープグラフライブラリ (https://www.dgl.ai/)
この文書で使用されているタスクをより深く理解するには、tasks_video.mp4 で短いビデオを見つけてください。
すべてのタスクの事前トレーニング済みモデルは、main/results/ フォルダーにあります。
random_cross タスク -> main/results/model_random_cross/
random_grid タスク -> main/results/model_random_grid/
unlabeled_goals タスク -> main/results/model_unlabeled/
図 1 の two_groups_cross -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
上記のコマンドは main/results/RESULT_DIR/plots/ にプロットを作成する必要があります。
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR には、model_random_cross、model_random_grid、model_unlabeled、model_2groups_cross を指定できます。
BASELINE には、tf-full、hard、dist、prog、prog-retrained、dt、dt-retrained、det、det-retrained を指定できます。
prog-retrained は、完全なアプローチに対応するバージョンであることに注意してください。
モデルを最初からトレーニングするには、次のスクリプトを実行します。 (この部分には数時間かかり、GPU が必要であることに注意してください)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh