Потрясающее принятие решений / обучение с подкреплением
Это бумажный список современных исследовательских материалов, связанных с принятием решений и планированием движения. Хотелось бы, чтобы это было полезно как для научных кругов, так и для промышленности. (Все еще обновляется)
Сопровождающие : Цзячен Ли (Калифорнийский университет, Беркли)
Электронная почта : [email protected]
Пожалуйста, не стесняйтесь отправлять запросы на добавление новых ресурсов или отправлять нам электронные письма для вопросов, обсуждения и сотрудничества.
Примечание . Здесь также представлена коллекция исследовательских материалов по прогнозированию траектории (поведения) с учетом взаимодействия.
RL, ИРЛ и ГЕЙЛ
- Глубокое обратное обучение с максимальной энтропией, 2015, [бумага]
- Управляемое обучение стоимости: глубокое обратное оптимальное управление посредством оптимизации политики, ICML 2016, [бумага]
- Генеративно-состязательное имитационное обучение, NIPS 2016, [бумага]
- Связь между генеративно-состязательными сетями, обратным обучением с подкреплением и моделями на основе энергии, NIPS 2016, [бумага]
- InfoGAIL: Интерпретируемое имитационное обучение на основе визуальных демонстраций, NIPS 2017, [бумага] [код]
- Обучение самоподражанию, ICML 2018, [бумага] [код]
- Эффективное иерархическое обучение с подкреплением данных, NIPS 2018, [бумага]
- Обучение надежным вознаграждениям с помощью состязательного обучения с обратным подкреплением, ICLR 2018, [бумага]
- Многоагентное генеративно-состязательное имитационное обучение, ICLR 2018, [бумага]
- Многоагентное состязательное обучение с обратным подкреплением, ICML 2019, [бумага]
Автономное вождение
- Обзор приложений глубокого обучения для автономного управления транспортными средствами, IEEE Transaction on ITS 2019, [бумага]
- Имитация поведения водителя с помощью генеративно-состязательных сетей, IV 2017, [бумага] [код]
- Многоагентное имитационное обучение для моделирования вождения, IROS 2018, [бумага] [код]
- Моделирование новых свойств поведения человека при вождении с использованием многоагентного обучения с расширенной имитацией с вознаграждением, ICRA 2019, [бумага] [код]
- Обучение на демонстрациях в дикой природе, ICRA 2018, [бумага]
- Многоагентное подключенное автономное вождение с использованием глубокого обучения с подкреплением, NeurIPS 2019, [бумага] [код]
- Глубокое обучение с подкреплением без модели для автономного вождения в городе, ITSC 2019, [бумага]
- Сквозное вождение посредством условного имитационного обучения, ICRA 2018, [бумага]
- CIRL: Контролируемое имитационное обучение с подкреплением для самостоятельного вождения на основе зрения, ECCV 2018, [бумага] [код]
- Подход, основанный на обучении с подкреплением, для автоматизированных маневров смены полосы движения, IV 2018 г., [документ]
- Состязательное обучение с обратным подкреплением для принятия решений при автономном вождении, ICRA 2020, [бумага]
- Глубокое иерархическое обучение с подкреплением для автономного вождения с различным поведением, IV 2018, [документ]
- Иерархическая архитектура для последовательного принятия решений при автономном вождении с использованием глубокого обучения с подкреплением, ICML 2019, [бумага]
- Комплексный интерпретируемый планировщик нейронных движений, CVPR 2019, [бумага]
- Совместное обучение поведению и планированию траектории беспилотных транспортных средств, IROS 2019, [бумага]
- Динамический ввод для глубокого обучения с подкреплением при автономном вождении, IROS 2019, [бумага]
- Учимся ориентироваться в городах без карты, NIPS 2018, [бумага]
- Масштабируемое комплексное тестирование автономных транспортных средств с помощью моделирования редких событий, NIPS 2018, [бумага]
- На пути к изучению многоагентных переговоров посредством самостоятельной игры, ICCV 2019, [бумага]
Симулятор и набор данных
- CARLA: открытый симулятор вождения в городе, [бумага]
- TORCS: Открытый симулятор гоночных автомобилей, [бумага]
- Comma.ai: Изучение симулятора вождения, [бумага]
- NGSIM: набор данных по шоссе 101 США, [документы]