¡Bienvenido a nuestro repositorio de GitHub! Este repositorio está dedicado a seleccionar artículos de investigación importantes en el campo del aprendizaje por refuerzo (RL) que han sido aceptados en las principales conferencias académicas como AAAI , IJCAI , NeurIPS , ICML , ICLR , ICRA , AAMAS y más. Le brindamos un conveniente centro de recursos para ayudarlo a mantenerse actualizado sobre los últimos desarrollos en aprendizaje por refuerzo, profundizar en las tendencias de investigación y explorar algoritmos y métodos de vanguardia.
Formato de rebajas:
- **Paper Name**.
[[pdf](link)]
[[code](link)]
- Author 1, Author 2, and Author 3. *conference, year*.
Ayúdeme a contribuir con esta lista comunicándose conmigo o agregando una solicitud de extracción.
Para cualquier pregunta, no dudes en ponerte en contacto conmigo.
Ajuste en línea para el aprendizaje por refuerzo de múltiples agentes descentralizado fuera de línea. [pdf]
Recompensar los ataques de envenenamiento en el aprendizaje por refuerzo de múltiples agentes fuera de línea. [pdf]
Modelos como agentes: optimización de predicciones de varios pasos de modelos locales interactivos en el aprendizaje por refuerzo de múltiples agentes basado en modelos. [pdf]
DeCOM: Política descompuesta para el aprendizaje por refuerzo cooperativo restringido de múltiples agentes. [pdf]
Metaaprendizaje cuántico por refuerzo de múltiples agentes. [pdf]
Aprendizaje de la asignación de créditos explícitos para el aprendizaje por refuerzo cooperativo de múltiples agentes a través del gradiente de políticas de polarización. [pdf]
Aprender de buenas trayectorias en el aprendizaje por refuerzo de múltiples agentes fuera de línea. [pdf]
DM²: Aprendizaje por refuerzo descentralizado de múltiples agentes mediante coincidencia de distribución. [pdf]
Aprendizaje por consenso para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
HAVEN: Aprendizaje por refuerzo jerárquico cooperativo multiagente con mecanismo de coordinación dual. [pdf]
DACOM: Comunicación consciente del retraso en el aprendizaje para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Suavizado de políticas certificadas para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
Mejora de la movilidad inteligente y sostenible con teoría de juegos y aprendizaje por refuerzo de múltiples agentes con aplicaciones para compartir viajes. [pdf]
Abordar el aprendizaje por refuerzo de múltiples agentes seguro y eficiente mediante el blindaje dinámico (resumen del estudiante). [pdf]
Aprendizaje por refuerzo de múltiples agentes para el refinamiento de malla adaptativa. [pdf]
Tasas de aprendizaje adaptativo para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Descomposición del valor adaptativo con cálculo codicioso de la contribución marginal para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
Un enfoque variado para la coordinación mutua basada en información para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo mediado por múltiples agentes. [pdf]
EXPODE: Aprovechamiento de la discrepancia de políticas para una exploración eficiente en el aprendizaje por refuerzo de múltiples agentes. [pdf]
AC2C: comunicación de dos saltos controlada de forma adaptativa para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje de la comunicación estructurada para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Comunicación dispersa basada en modelos en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo cooperativo secuencial multiagente. [pdf]
Aprendizaje por refuerzo asincrónico de múltiples agentes para una exploración cooperativa eficiente de múltiples robots en tiempo real. [pdf]
Aprendizaje de múltiples asesores independientes en aprendizaje por refuerzo multiagente. [pdf]
CraftEnv: un entorno de construcción robótica colectiva flexible para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo multiagente con capa de seguridad para control activo de voltaje. [pdf]
Blindaje dinámico basado en modelos para un aprendizaje por refuerzo multiagente seguro y eficiente. [pdf]
Hacia una exploración optimista basada en riesgos para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
Refinamiento de políticas guiado por contraejemplos en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Minería de tareas priorizadas para el aprendizaje por refuerzo cooperativo de múltiples tareas y agentes. [pdf]
TransfQMix: transformadores para aprovechar la estructura gráfica de problemas de aprendizaje por refuerzo de múltiples agentes. [pdf]
Uso compartido de parámetros con poda de red para un aprendizaje por refuerzo profundo escalable con múltiples agentes. [pdf]
Hacia la explicación de secuencias de acciones en modelos de aprendizaje por refuerzo profundo de múltiples agentes. [pdf]
Aprendizaje por refuerzo profundo de múltiples agentes para la creación de mercados múltiples de alta frecuencia. [pdf]
Aprendizaje de recompensas de diferencia individual en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo fuera de lo común con múltiples agentes. [pdf]
Compartir experiencias de forma selectiva mejora el aprendizaje por refuerzo entre múltiples agentes. [pdf]
MARL fuera de la red: conjuntos de datos y líneas de base para el aprendizaje por refuerzo de múltiples agentes fuera de línea. [pdf]
Ataque adversario de caja gris a la comunicación en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo de múltiples agentes para una respuesta a la demanda en escalas de tiempo rápidas de cargas residenciales. [pdf]
Aprender a autoconfigurarse para robots modulares de forma libre mediante el aprendizaje por refuerzo de múltiples agentes altruistas. [pdf]
Búsqueda de rutas de agentes múltiples mediante aprendizaje por refuerzo con recompensa híbrida. [pdf]
Soluciones de aprendizaje en grandes redes económicas mediante aprendizaje por refuerzo profundo de múltiples agentes. [pdf]
Aprendizaje por refuerzo de múltiples agentes fuera de línea con factorización de valor acoplado. [pdf]
Detección de causalidad para un aprendizaje por refuerzo eficiente de múltiples agentes. [pdf]
Recurrencia basada en la atención para el aprendizaje por refuerzo de múltiples agentes bajo incertidumbre estatal. [pdf]
Diseño justo de redes de transporte mediante aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo en sistemas multiobjetivo y multiagente. [pdf]
Mejora de la movilidad inteligente y sostenible con teoría de juegos y aprendizaje por refuerzo de múltiples agentes. [pdf]
Facilitador activo con estado: coordinación y heterogeneidad ambiental en el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
MACTA: un enfoque de aprendizaje por refuerzo de múltiples agentes para la detección y los ataques de sincronización de caché. [pdf]
MAESTRO: Diseño de entorno abierto para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Leyes de escala para un modelo de aprendizaje por refuerzo de múltiples agentes. [pdf]
RPM: Políticas multiagente generalizables para el aprendizaje por refuerzo multiagente. [pdf]
Descubrimiento y utilización de conversaciones económicas en el aprendizaje por refuerzo de múltiples agentes. [pdf]
El pedido importa: optimización de políticas agente por agente. [pdf]
Métodos de actor crítico de red bayesiana consciente del contexto para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
Divisor de entidades con base lingüística en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Oráculos y seguidores: equilibrios de Stackelberg en el aprendizaje por refuerzo profundo de múltiples agentes. [pdf]
Un marco adaptativo de regularización de entropía para el aprendizaje por refuerzo de múltiples agentes. [pdf]
RACE: Mejorar el aprendizaje por refuerzo de múltiples agentes con asimetría de representación y evolución colaborativa. [pdf]
Agentes perezosos: una nueva perspectiva para resolver el problema de las recompensas escasas en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje cooperativo por refuerzo de múltiples agentes: comunicación asincrónica y aproximación de funciones lineales. [pdf]
Aprendizaje por refuerzo escalable de múltiples agentes mediante agregación inteligente de información. [pdf]
Recurrencia basada en la atención para el aprendizaje por refuerzo de múltiples agentes bajo observabilidad parcial estocástica. [pdf]
Atención complementaria para el aprendizaje por refuerzo multiagente. [pdf]
La optimización local logra la optimización global en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Persecución de objetivos múltiples por parte de un enjambre de vehículos aéreos no tripulados heterogéneos y descentralizados utilizando el aprendizaje por refuerzo profundo de múltiples agentes. [pdf]
Asesoramiento de acción explicable para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje reforzado multiagente seguro con conciencia espacial y temporal de vehículos autónomos conectados en escenarios desafiantes. [pdf]
Método de aprendizaje por refuerzo de múltiples agentes restringido por conflictos para la planificación de trayectorias de estacionamiento. [pdf]
Aprendizaje por refuerzo explicable de múltiples agentes para consultas temporales. [pdf]
Comunicación escalable para el aprendizaje reforzado con múltiples agentes a través de un mecanismo de correo electrónico basado en transformador. [pdf]
Aprender a enviar refuerzos: coordinar el envío y la reprogramación de patrullas policiales dinámicas de múltiples agentes mediante el aprendizaje por refuerzo. [pdf]
Detección de anomalías descentralizada en el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
GPLight: Aprendizaje por refuerzo agrupado de múltiples agentes para el control de señales de tráfico a gran escala. [pdf]
Gráfico de comunicación jerárquica profunda en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Modelado de elecciones morales en dilemas sociales con aprendizaje por refuerzo de múltiples agentes. [pdf]
Inducción del equilibrio de Stackelberg mediante la toma de decisiones secuencial espacio-temporal en el aprendizaje por refuerzo de múltiples agentes. [pdf]
Segmentación neuronal autosupervisada con aprendizaje por refuerzo de múltiples agentes. [pdf]
MA2CL: Aprendizaje contrastivo atento enmascarado para el aprendizaje por refuerzo de múltiples agentes. [pdf]
Aprendizaje por refuerzo competitivo-cooperativo de múltiples agentes para el aprendizaje federado basado en subastas. [pdf]
DPMAC: Comunicación diferencialmente privada para el aprendizaje cooperativo por refuerzo de múltiples agentes. [pdf]
Si utiliza esta caja de herramientas en su investigación, cite este proyecto.
@misc{YalunAwesome,
author = {Yalun Wu},
title = {Reinforcement-Learning-Papers},
year = {2023},
howpublished = {url{https://github.com/Allenpandas/Reinforcement-Learning-Papers}}
}