Python3
OpenAI Gym 0.11.0
PyTorch
Bibliothèque de graphiques approfondie (https://www.dgl.ai/)
Veuillez trouver une courte vidéo sur task_video.mp4 pour mieux comprendre les tâches utilisées dans cet article.
Vous pouvez trouver les modèles pré-entraînés pour toutes les tâches dans le dossier main/results/.
tâche random_cross -> main/results/model_random_cross/
tâche random_grid -> main/results/model_random_grid/
tâche unlabeled_goals -> main/results/model_unlabeled/
two_groups_cross dans la figure 1 -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
Les cmd ci-dessus devraient créer des tracés dans main/results/RESULT_DIR/plots/
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR peut être model_random_cross, model_random_grid, model_unlabeled, model_2groups_cross.
BASELINE peut être tf-full, hard, dist, prog, prog-retrained, dt, dt-retrained, det, det-retrained.
Notez que prog-retrained est la version correspondant à notre approche complète.
Pour entraîner des modèles à partir de zéro, exécutez les scripts suivants. (Notez que cette partie prend plusieurs heures et nécessite des GPU)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh