Pitón 3
Gimnasio OpenAI 0.11.0
PyTorch
Biblioteca de gráficos profundos (https://www.dgl.ai/)
Encuentre un video breve en task_video.mp4 para comprender mejor las tareas utilizadas en este documento.
Puede encontrar los modelos previamente entrenados para todas las tareas en la carpeta principal/resultados/.
tarea random_cross -> principal/resultados/model_random_cross/
tarea random_grid -> principal/resultados/model_random_grid/
tarea unlabeled_goals -> principal/resultados/model_unlabeled/
two_groups_cross en la Figura 1 -> principal/resultados/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
Los cmds anteriores deberían crear gráficos en main/results/RESULT_DIR/plots/
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR puede ser model_random_cross, model_random_grid, model_unlabeled, model_2groups_cross.
BASELINE puede ser tf-full, hard, dist, prog, prog-retrained, dt, dt-retrained, det, det-retrained.
Tenga en cuenta que prog-retrained es la versión correspondiente a nuestro enfoque completo.
Para entrenar modelos desde cero, ejecute los siguientes scripts. (Tenga en cuenta que esta parte lleva varias horas y requiere GPU)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh