Ce référentiel contient les notes du cours Reinforcement Learning de David Silver ainsi que l'implémentation des différents algorithmes discutés, à la fois dans Keras (avec backend TensorFlow) et dans le framework gym d'OpenAI.
Semaine 1 : Introduction à l'apprentissage par renforcement [diapo][vidéo]
Semaine 2 : Processus décisionnels markoviens [diapo][vidéo]
Semaine 3 : Planification par programmation dynamique [diapo][vidéo]
Semaine 4 : Prédiction sans modèle [diapo][vidéo]
Semaine 5 : Contrôle sans modèle [diapo][vidéo]
Semaine 6 : approximation de la fonction de valeur [diapositive][vidéo]
Semaine 7 : Méthodes de gradient politique [diapo][vidéo]
Semaine 8 : Intégrer l'apprentissage et la planification [diapo][vidéo]
Semaine 9 : Exploration et exploitation [diapo][vidéo]
Semaine 10 : Étude de cas : RL dans les jeux classiques [diapo][vidéo]
Installez-les en utilisant pip.
N'hésitez pas à créer une Pull Request pour ajouter des implémentations des algorithmes discutés dans différents frameworks comme PyTorch, Caffe, etc. ou améliorer les implémentations existantes. Si vous êtes débutant, vous pouvez vous y référer pour commencer.
Si vous avez trouvé cela utile, pensez à mettre en vedette (★) le dépôt afin qu'il puisse atteindre un public plus large.
Ce projet est sous licence MIT - voir le fichier LICENSE pour plus de détails.