Питон 3
OpenAI Тренажерный зал 0.11.0
PyTorch
Глубокая библиотека графов (https://www.dgl.ai/)
Чтобы лучше понять задачи, используемые в этой статье, найдите короткое видео на сайте Tasks_video.mp4.
Вы можете найти предварительно обученные модели для всех задач в папке main/results/.
Задача random_cross -> main/results/model_random_cross/
Задача random_grid -> main/results/model_random_grid/
задача unlabeled_goals -> main/results/model_unlabeled/
two_groups_cross на рисунке 1 -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
Вышеупомянутые cmds должны создавать графики в файле main/results/RESULT_DIR/plots/.
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR может быть model_random_cross, model_random_grid, model_unlabeled, model_2groups_cross.
BASELINE может быть tf-full, hard, dist, prog, prog-retrained, dt, dt-retrained, det, det-retrained.
Обратите внимание, что prog-retrained — это версия, соответствующая нашему полному подходу.
Чтобы обучить модели с нуля, запустите следующие сценарии. (Обратите внимание, что эта часть занимает несколько часов и требует графических процессоров)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh