Pitão 3
Ginásio OpenAI 0.11.0
PyTorch
Biblioteca de gráficos profundos (https://www.dgl.ai/)
Encontre um pequeno vídeo em tasks_video.mp4 para entender melhor as tarefas usadas neste artigo.
Você pode encontrar os modelos pré-treinados para todas as tarefas na pasta principal/resultados/.
tarefa random_cross -> main/resultados/model_random_cross/
tarefa random_grid -> main/resultados/model_random_grid/
tarefa unlabeled_goals -> main/resultados/model_unlabeled/
two_groups_cross na Figura 1 -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
Os cmds acima devem criar gráficos em main/results/RESULT_DIR/plots/
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR pode ser model_random_cross, model_random_grid, model_unlabeled, model_2groups_cross.
BASELINE pode ser tf-full, hard, dist, prog, prog-retrained, dt, dt-retrained, det, det-retrained.
Observe que prog-retrained é a versão correspondente à nossa abordagem completa.
Para treinar modelos do zero, execute os scripts a seguir. (Observe que esta parte leva várias horas e requer GPUs)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh