Impresionante toma de decisiones/aprendizaje por refuerzo
Esta es una lista impresa de materiales de investigación de última generación relacionados con la toma de decisiones y la planificación de movimientos. Ojalá pudiera ser útil tanto para la academia como para la industria. (Aún actualizando)
Mantenedores : Jiachen Li (Universidad de California, Berkeley)
Correo electrónico : [email protected]
No dude en enviarnos una solicitud para agregar nuevos recursos o enviarnos correos electrónicos para preguntas, debates y colaboraciones.
Nota : Aquí también hay una colección de materiales de investigación para la predicción de trayectorias (comportamiento) conscientes de la interacción.
RL, IRL y GAIL
- Aprendizaje por refuerzo inverso profundo de máxima entropía, 2015, [artículo]
- Aprendizaje guiado de costos: control óptimo inverso profundo mediante optimización de políticas, ICML 2016, [artículo]
- Aprendizaje generativo por imitación adversarial, NIPS 2016, [artículo]
- Una conexión entre redes generativas adversarias, aprendizaje por refuerzo inverso y modelos basados en energía, NIPS 2016, [artículo]
- InfoGAIL: Aprendizaje de imitación interpretable a partir de demostraciones visuales, NIPS 2017, [artículo] [código]
- Aprendizaje por autoimitación, ICML 2018, [artículo] [código]
- Aprendizaje por refuerzo jerárquico eficiente en datos, NIPS 2018, [artículo]
- Aprendizaje de recompensas sólidas con aprendizaje por refuerzo inverso adversario, ICLR 2018, [artículo]
- Aprendizaje por imitación adversario generativo de agentes múltiples, ICLR 2018, [artículo]
- Aprendizaje por refuerzo inverso adversario de múltiples agentes, ICML 2019, [artículo]
Conducción autónoma
- Una encuesta sobre aplicaciones de aprendizaje profundo para el control de vehículos autónomos, IEEE Transaction on ITS 2019, [artículo]
- Imitación del comportamiento del conductor con redes generativas adversarias, IV 2017, [artículo] [código]
- Aprendizaje de imitación de múltiples agentes para simulación de conducción, IROS 2018, [artículo] [código]
- Simulación de propiedades emergentes del comportamiento de conducción humana mediante el aprendizaje de imitación aumentado con recompensas de múltiples agentes, ICRA 2019, [artículo] [código]
- Aprendiendo de la demostración en la naturaleza, ICRA 2018, [artículo]
- Conducción autónoma conectada con múltiples agentes mediante aprendizaje por refuerzo profundo, NeurIPS 2019, [artículo] [código]
- Aprendizaje por refuerzo profundo sin modelos para la conducción autónoma urbana, ITSC 2019, [artículo]
- Conducción de un extremo a otro mediante aprendizaje por imitación condicional, ICRA 2018, [artículo]
- CIRL: Aprendizaje por refuerzo imitativo controlable para la conducción autónoma basada en la visión, ECCV 2018, [artículo] [código]
- Un enfoque basado en el aprendizaje por refuerzo para maniobras de cambio de carril automatizado, IV 2018, [artículo]
- Aprendizaje por refuerzo inverso adversario para la toma de decisiones en la conducción autónoma, ICRA 2020, [artículo]
- Aprendizaje por refuerzo jerárquico profundo para la conducción autónoma con distintos comportamientos, IV 2018, [artículo]
- Una arquitectura jerárquica para la toma de decisiones secuencial en la conducción autónoma mediante el aprendizaje por refuerzo profundo, ICML 2019, [artículo]
- Planificador de movimiento neuronal interpretable de extremo a extremo, CVPR 2019, [artículo]
- Planificación de trayectoria y comportamiento que se pueden aprender de forma conjunta para vehículos autónomos, IROS 2019, [artículo]
- Entrada dinámica para el aprendizaje por refuerzo profundo en la conducción autónoma, IROS 2019, [artículo]
- Aprender a navegar en ciudades sin mapa, NIPS 2018, [artículo]
- Pruebas escalables de vehículos autónomos de extremo a extremo mediante simulación de eventos raros, NIPS 2018, [artículo]
- Hacia el aprendizaje de negociaciones entre agentes múltiples a través del juego autónomo, ICCV 2019, [artículo]
Simulador y conjunto de datos
- CARLA: Un simulador de conducción urbana abierta, [artículo]
- TORCS: El simulador de coches de carreras abierto, [artículo]
- Comma.ai: Aprender un simulador de conducción, [artículo]
- NGSIM: conjunto de datos de la autopista 101 de EE. UU., [docs]