Bienvenue sur notre référentiel GitHub ! Ce référentiel est dédié à la conservation d'articles de recherche importants dans le domaine de l'apprentissage par renforcement (RL) qui ont été acceptés lors de conférences universitaires de premier plan telles que AAAI , IJCAI , NeurIPS , ICML , ICLR , ICRA , AAMAS et plus encore. Nous mettons à votre disposition un centre de ressources pratique pour vous aider à rester informé des derniers développements en matière d'apprentissage par renforcement, à vous plonger dans les tendances de la recherche et à explorer des algorithmes et des méthodes de pointe.
Format de démarque :
- **Paper Name**.
[[pdf](link)]
[[code](link)]
- Author 1, Author 2, and Author 3. *conference, year*.
S'il vous plaît, aidez-moi à contribuer à cette liste en me contactant ou en ajoutant une pull request.
Pour toute question, n'hésitez pas à me contacter ?.
Réglage en ligne pour l'apprentissage par renforcement multi-agent décentralisé hors ligne. [pdf]
Récompensez les attaques d’empoisonnement grâce à l’apprentissage par renforcement multi-agents hors ligne. [pdf]
Modèles en tant qu'agents : optimisation des prédictions en plusieurs étapes de modèles locaux interactifs dans l'apprentissage par renforcement multi-agents basé sur des modèles. [pdf]
DeCOM : Politique décomposée pour l'apprentissage par renforcement coopératif multi-agent contraint. [pdf]
Apprentissage par méta-renforcement multi-agents quantiques. [pdf]
Apprentissage de l'attribution explicite de crédits pour l'apprentissage coopératif par renforcement multi-agents via un gradient de politique de polarisation. [pdf]
Apprendre de bonnes trajectoires dans l’apprentissage par renforcement multi-agents hors ligne. [pdf]
DM² : Apprentissage par renforcement multi-agent décentralisé via l'appariement de distribution. [pdf]
Apprentissage par consensus pour l'apprentissage coopératif par renforcement multi-agents. [pdf]
HAVEN : Apprentissage coopératif hiérarchique par renforcement multi-agents avec mécanisme de double coordination. [pdf]
DACOM : Communication sensible aux délais d'apprentissage pour l'apprentissage par renforcement multi-agents. [pdf]
Lissage certifié des politiques pour l’apprentissage coopératif par renforcement multi-agents. [pdf]
Améliorer la mobilité intelligente et durable grâce à la théorie des jeux et à l'apprentissage par renforcement multi-agents avec des applications de covoiturage. [pdf]
Aborder l'apprentissage par renforcement multi-agents sûr et efficace via le blindage dynamique (résumé étudiant). [pdf]
Apprentissage par renforcement multi-agents pour le raffinement adaptatif du maillage. [pdf]
Taux d'apprentissage adaptatif pour l'apprentissage par renforcement multi-agents. [pdf]
Décomposition adaptative de la valeur avec calcul de contribution marginale gourmande pour l'apprentissage coopératif par renforcement multi-agents. [pdf]
Une approche variationnelle de la coordination mutuelle basée sur l'information pour l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents médié. [pdf]
EXPODE : EXploiter les écarts de politique pour une exploration efficace dans l'apprentissage par renforcement multi-agents. [pdf]
AC2C : communication à deux sauts contrôlée de manière adaptative pour l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage de la communication structurée pour l'apprentissage par renforcement multi-agents. [pdf]
Communication clairsemée basée sur un modèle dans l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage coopératif séquentiel par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents asynchrone pour une exploration coopérative multi-robots en temps réel efficace. [pdf]
Apprendre de plusieurs conseillers indépendants en apprentissage par renforcement multi-agents. [pdf]
CraftEnv : un environnement de construction robotique collective flexible pour l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents avec couche de sécurité pour le contrôle actif de la tension. [pdf]
Blindage dynamique basé sur un modèle pour un apprentissage par renforcement multi-agents sûr et efficace. [pdf]
Vers une exploration optimiste basée sur les risques pour un apprentissage coopératif par renforcement multi-agents. [pdf]
Affinement des politiques guidé par contre-exemple dans l'apprentissage par renforcement multi-agents. [pdf]
Exploration de tâches prioritaires pour l'apprentissage par renforcement coopératif multi-agents multi-tâches. [pdf]
TransfQMix : transformateurs pour exploiter la structure graphique des problèmes d'apprentissage par renforcement multi-agents. [pdf]
Partage de paramètres avec élagage du réseau pour un apprentissage par renforcement approfondi multi-agents évolutif. [pdf]
Vers l'explication des séquences d'actions dans les modèles d'apprentissage par renforcement profond multi-agents. [pdf]
Apprentissage par renforcement approfondi multi-agents pour la création de marchés multi-marchés à haute fréquence. [pdf]
Apprentissage des récompenses de différence individuelle dans l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents décalé. [pdf]
Le partage sélectif d'expériences améliore l'apprentissage par renforcement multi-agents. [pdf]
MARL hors réseau : ensembles de données et lignes de base pour l'apprentissage par renforcement multi-agents hors ligne. [pdf]
Attaque contradictoire en boîte grise contre la communication dans l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents pour une réponse rapide à la demande des charges résidentielles. [pdf]
Apprendre à s'auto-reconfigurer pour les robots modulaires de forme libre via l'apprentissage par renforcement multi-agents altruiste. [pdf]
Recherche de chemin multi-agents via l'apprentissage par renforcement avec récompense hybride. [pdf]
Solutions d'apprentissage dans les grands réseaux économiques utilisant l'apprentissage par renforcement multi-agent approfondi. [pdf]
Apprentissage par renforcement multi-agents hors ligne avec factorisation de valeur couplée. [pdf]
Détection de causalité pour un apprentissage par renforcement multi-agent efficace. [pdf]
Récurrence basée sur l'attention pour l'apprentissage par renforcement multi-agents dans des conditions d'incertitude d'état. [pdf]
Conception équitable de réseaux de transport utilisant l’apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement dans les systèmes multi-objectifs multi-agents. [pdf]
Améliorer la mobilité intelligente et durable grâce à la théorie des jeux et à l'apprentissage par renforcement multi-agents. [pdf]
Facilitateur actif avec état : coordination et hétérogénéité environnementale dans l'apprentissage coopératif par renforcement multi-agents. [pdf]
MACTA : une approche d'apprentissage par renforcement multi-agents pour les attaques et la détection par synchronisation du cache. [pdf]
MAESTRO : Conception d'environnement ouvert pour l'apprentissage par renforcement multi-agents. [pdf]
Lois de mise à l'échelle pour un modèle d'apprentissage par renforcement multi-agents. [pdf]
RPM : Politiques multi-agents généralisables pour l'apprentissage par renforcement multi-agents. [pdf]
Découverte et utilisation de conversations bon marché dans l'apprentissage par renforcement multi-agents. [pdf]
Questions de commande : optimisation des politiques agent par agent. [pdf]
Méthodes acteur-critique du réseau bayésien contextuel pour l'apprentissage coopératif par renforcement multi-agents. [pdf]
Diviseur d'entité avec base linguistique dans l'apprentissage par renforcement multi-agents. [pdf]
Oracles et suiveurs : équilibres de Stackelberg dans l'apprentissage par renforcement multi-agents approfondi. [pdf]
Un cadre adaptatif de régularisation d'entropie pour l'apprentissage par renforcement multi-agents. [pdf]
RACE : Améliorez l'apprentissage par renforcement multi-agents avec l'asymétrie de représentation et l'évolution collaborative. [pdf]
Agents paresseux : une nouvelle perspective sur la résolution du problème de récompense clairsemée dans l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage coopératif par renforcement multi-agents : communication asynchrone et approximation des fonctions linéaires. [pdf]
Apprentissage par renforcement multi-agents évolutif grâce à l'agrégation intelligente d'informations. [pdf]
Récurrence basée sur l'attention pour l'apprentissage par renforcement multi-agents sous observabilité partielle stochastique. [pdf]
Attention complémentaire pour l'apprentissage par renforcement multi-agents. [pdf]
L'optimisation locale permet d'atteindre l'optimalité globale dans l'apprentissage par renforcement multi-agents. [pdf]
Poursuite multi-cibles par un essaim de drones hétérogènes décentralisés utilisant un apprentissage par renforcement multi-agents approfondi. [pdf]
Conseil d'action explicable pour l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents sécurisé, spatial et temporel, des véhicules autonomes connectés dans des scénarios difficiles. [pdf]
Méthode d'apprentissage par renforcement multi-agents contraints par les conflits pour la planification des trajectoires de stationnement. [pdf]
Apprentissage par renforcement multi-agent explicable pour les requêtes temporelles. [pdf]
Communication évolutive pour l'apprentissage par renforcement multi-agents via un mécanisme de messagerie basé sur un transformateur. [pdf]
Apprendre à envoyer des renforts : coordonner la répartition et la reprogrammation de patrouilles de police dynamiques multi-agents via l'apprentissage par renforcement. [pdf]
Détection décentralisée des anomalies dans l'apprentissage coopératif par renforcement multi-agents. [pdf]
GPLight : Apprentissage par renforcement multi-agents groupé pour le contrôle des feux de circulation à grande échelle. [pdf]
Graphique de communication hiérarchique profond dans l'apprentissage par renforcement multi-agents. [pdf]
Modélisation des choix moraux dans les dilemmes sociaux avec l'apprentissage par renforcement multi-agents. [pdf]
Induire l'équilibre de Stackelberg grâce à la prise de décision séquentielle spatio-temporelle dans l'apprentissage par renforcement multi-agents. [pdf]
Segmentation neuronale auto-supervisée avec apprentissage par renforcement multi-agents. [pdf]
MA2CL : Apprentissage contrastif attentif masqué pour l'apprentissage par renforcement multi-agents. [pdf]
Apprentissage par renforcement multi-agents compétitif-coopératif pour l'apprentissage fédéré basé sur les enchères. [pdf]
DPMAC : Communication différentiellement privée pour l’apprentissage coopératif par renforcement multi-agents. [pdf]
Si vous utilisez cette boîte à outils dans vos recherches, veuillez citer ce projet.
@misc{YalunAwesome,
author = {Yalun Wu},
title = {Reinforcement-Learning-Papers},
year = {2023},
howpublished = {url{https://github.com/Allenpandas/Reinforcement-Learning-Papers}}
}