بايثون 3
OpenAI جيم 0.11.0
باي تورش
مكتبة الرسوم البيانية العميقة (https://www.dgl.ai/)
يرجى العثور على مقطع فيديو قصير على Task_video.mp4 للحصول على فهم أفضل للمهام المستخدمة في هذه الورقة.
يمكنك العثور على النماذج المدربة مسبقًا لجميع المهام في المجلد الرئيسي/النتائج/.
مهمة Random_cross -> main/results/model_random_cross/
مهمة Random_grid -> main/results/model_random_grid/
مهمة unlabeled_goals -> main/results/model_unlabeled/
two_groups_cross في الشكل 1 -> main/results/model_2groups_cross/
# To generate plots for Figures 2 and 6
# Random cross
python3 -m main.plot_results --result_dir=model_random_cross --env=FormationTorch-v0
# Random grid
python3 -m main.plot_results --result_dir=model_random_grid --env=FormationTorch-v0
# Random cross
python3 -m main.plot_results --result_dir=model_unlabeled --env=UnlabeledGoals-v0
يجب أن تقوم أوامر cmd المذكورة أعلاه بإنشاء مخططات على main/results/RESULT_DIR/plots/
python3 -m main.replay --result_dir=RESULT_DIR --baseline=BASELINE
RESULT_DIR يمكن أن يكون model_random_cross، وmodel_random_grid، وmodel_unlabeled، وmodel_2groups_cross.
BASELINE يمكن أن يكون tf-full، hard، dist، prog، prog-retrained، dt، dt-retrained، det، det-retrained.
لاحظ أن prog-retrained هو الإصدار المطابق لمنهجنا الكامل.
لتدريب النماذج من البداية، قم بتشغيل البرامج النصية التالية. (لاحظ أن هذا الجزء يستغرق عدة ساعات ويتطلب وحدات معالجة الرسومات)
# Random cross
bash run_random_cross.sh
# Random grid
bash run_random_grid.sh
# Random cross
bash run_unlabeled_goals.sh