很棒的決策/強化學習
這是與決策和運動規劃相關的最先進研究材料的論文清單。希望對學術界和工業界都有幫助。 (仍在更新)
維護者: Jiachen Li (加州大學柏克萊分校)
電子郵件:[email protected]
請隨時提出請求以新增新資源或向我們發送電子郵件以提出問題、討論和協作。
注意:這裡也是互動感知軌跡(行為)預測的研究資料的集合。
RL & IRL & 蓋爾
- 最大熵深度逆強化學習,2015,[論文]
- 引導成本學習:透過策略最佳化進行深度逆最適控制,ICML 2016,[論文]
- 生成對抗性模仿學習,NIPS 2016,[論文]
- 生成對抗網路、逆強化學習和基於能量的模型之間的聯繫,NIPS 2016,[論文]
- InfoGAIL:從視覺演示中進行可解釋的模仿學習,NIPS 2017,[論文] [代碼]
- 自模仿學習,ICML 2018,[論文][程式碼]
- 資料高效的分層強化學習,NIPS 2018,[論文]
- 透過對抗性逆加強學習穩健獎勵,ICLR 2018,[論文]
- 多智能體生成對抗性模仿學習,ICLR 2018,[論文]
- 多智能體對抗逆強化學習,ICML 2019,[論文]
自動駕駛
- 深度學習在自動駕駛車輛控制的應用綜述,IEEE Transaction on ITS 2019,[論文]
- 使用生成對抗網路模仿駕駛行為,IV 2017,[論文] [程式碼]
- 用於駕駛模擬的多智能體模仿學習,IROS 2018,[論文] [代碼]
- 使用多智能體獎勵增強模仿學習模擬人類駕駛行為的新興特性,ICRA 2019,[論文] [代碼]
- 從野外示範中學習,ICRA 2018,[論文]
- 使用深度強化學習的多智能體互聯自動駕駛,NeurIPS 2019,[論文] [代碼]
- 城市自動駕駛的無模型深度強化學習,ITSC 2019,[論文]
- 透過條件模仿學習實現端到端駕駛,ICRA 2018,[論文]
- CIRL:基於視覺的自動駕駛的可控模仿強化學習,ECCV 2018,[論文][代碼]
- 基於強化學習的自動變換車道操作方法,IV 2018,[論文]
- 自動駕駛決策的對抗性逆強化學習,ICRA 2020,[論文]
- 具有不同行為的自動駕駛的深度分層強化學習,IV 2018,[論文]
- 使用深度強化學習的自動駕駛順序決策的分層架構,ICML 2019,[論文]
- 端到端可解釋神經運動規劃器,CVPR 2019,[論文]
- 自動駕駛車輛的聯合學習行為和軌跡規劃,IROS 2019,[論文]
- 自動駕駛中深度強化學習的動態輸入,IROS 2019,[論文]
- 學習在沒有地圖的城市中導航,NIPS 2018,[論文]
- 透過罕見事件模擬進行可擴展的端到端自動駕駛汽車測試,NIPS 2018,[論文]
- 透過自我對弈學習多智能體談判,ICCV 2019,[論文]
模擬器和資料集
- CARLA:開放式城市駕駛模擬器,[論文]
- TORCS:開放式賽車模擬器,[論文]
- Comma.ai:學習駕駛模擬器,[論文]
- NGSIM:美國 101 號公路資料集,[文件]