Dieses Repository enthält die Notizen zum Reinforcement Learning-Kurs von David Silver sowie die Implementierung der verschiedenen besprochenen Algorithmen, sowohl in Keras (mit TensorFlow-Backend) als auch im Gym-Framework von OpenAI.
Woche 1: Einführung in Reinforcement Learning [Folie][Video]
Woche 2: Markov-Entscheidungsprozesse [Folie][Video]
Woche 3: Planung durch dynamische Programmierung [Folie][Video]
Woche 4: Modellfreie Vorhersage [Folie][Video]
Woche 5: Modellfreie Kontrolle [Folie][Video]
Woche 6: Wertfunktionsnäherung [Folie][Video]
Woche 7: Policy-Gradient-Methoden [Folie][Video]
Woche 8: Integration von Lernen und Planung [Folie][Video]
Woche 9: Erkundung und Ausbeutung [Folie][Video]
Woche 10: Fallstudie: RL in klassischen Spielen [Folie][Video]
Installieren Sie sie mit pip.
Sie können gerne eine Pull-Anfrage erstellen, um Implementierungen der in verschiedenen Frameworks wie PyTorch, Caffe usw. besprochenen Algorithmen hinzuzufügen oder die vorhandenen Implementierungen zu verbessern. Wenn Sie ein Anfänger sind, können Sie dies als Einstieg verwenden.
Wenn Sie dies nützlich fanden, denken Sie bitte darüber nach, das Repo mit einem Sternchen (★) zu versehen, damit es ein breiteres Publikum erreichen kann.
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der LIZENZ-Datei.