很棒的决策/强化学习
这是与决策和运动规划相关的最先进研究材料的论文列表。希望对学术界和工业界都有帮助。 (仍在更新中)
维护者: Jiachen Li (加州大学伯克利分校)
电子邮件:[email protected]
请随时提出请求以添加新资源或向我们发送电子邮件以提出问题、讨论和协作。
注意:这里也是交互感知轨迹(行为)预测的研究材料的集合。
RL & IRL & 盖尔
- 最大熵深度逆强化学习,2015,[论文]
- 引导成本学习:通过策略优化进行深度逆最优控制,ICML 2016,[论文]
- 生成对抗性模仿学习,NIPS 2016,[论文]
- 生成对抗网络、逆强化学习和基于能量的模型之间的联系,NIPS 2016,[论文]
- InfoGAIL:从视觉演示中进行可解释的模仿学习,NIPS 2017,[论文] [代码]
- 自模仿学习,ICML 2018,[论文][代码]
- 数据高效的分层强化学习,NIPS 2018,[论文]
- 通过对抗性逆强化学习学习稳健奖励,ICLR 2018,[论文]
- 多智能体生成对抗性模仿学习,ICLR 2018,[论文]
- 多智能体对抗逆强化学习,ICML 2019,[论文]
自动驾驶
- 深度学习在自动驾驶车辆控制中的应用综述,IEEE Transaction on ITS 2019,[论文]
- 使用生成对抗网络模仿驾驶员行为,IV 2017,[论文] [代码]
- 用于驾驶模拟的多智能体模仿学习,IROS 2018,[论文] [代码]
- 使用多智能体奖励增强模仿学习模拟人类驾驶行为的新兴特性,ICRA 2019,[论文] [代码]
- 从野外示范中学习,ICRA 2018,[论文]
- 使用深度强化学习的多智能体互联自动驾驶,NeurIPS 2019,[论文] [代码]
- 城市自动驾驶的无模型深度强化学习,ITSC 2019,[论文]
- 通过条件模仿学习实现端到端驾驶,ICRA 2018,[论文]
- CIRL:基于视觉的自动驾驶的可控模仿强化学习,ECCV 2018,[论文][代码]
- 基于强化学习的自动变道操作方法,IV 2018,[论文]
- 自动驾驶决策的对抗性逆强化学习,ICRA 2020,[论文]
- 具有不同行为的自动驾驶的深度分层强化学习,IV 2018,[论文]
- 使用深度强化学习的自动驾驶顺序决策的分层架构,ICML 2019,[论文]
- 端到端可解释神经运动规划器,CVPR 2019,[论文]
- 自动驾驶车辆的联合学习行为和轨迹规划,IROS 2019,[论文]
- 自动驾驶中深度强化学习的动态输入,IROS 2019,[论文]
- 学习在没有地图的城市中导航,NIPS 2018,[论文]
- 通过罕见事件模拟进行可扩展的端到端自动驾驶汽车测试,NIPS 2018,[论文]
- 通过自我对弈学习多智能体谈判,ICCV 2019,[论文]
模拟器和数据集
- CARLA:开放式城市驾驶模拟器,[论文]
- TORCS:开放式赛车模拟器,[论文]
- Comma.ai:学习驾驶模拟器,[论文]
- NGSIM:美国 101 号公路数据集,[文档]