Este repositorio contiene las notas para el curso de Aprendizaje por refuerzo de David Silver junto con la implementación de los diversos algoritmos discutidos, tanto en Keras (con backend de TensorFlow) como en el marco de gimnasio de OpenAI.
Semana 1: Introducción al aprendizaje por refuerzo [diapositiva][vídeo]
Semana 2: Procesos de decisión de Markov [diapositiva][vídeo]
Semana 3: Planificación mediante programación dinámica [diapositiva][vídeo]
Semana 4: Predicción sin modelos [diapositiva][vídeo]
Semana 5: Control sin modelos [diapositiva][vídeo]
Semana 6: Aproximación de la función de valor [diapositiva][vídeo]
Semana 7: Métodos de gradiente de políticas [diapositiva][vídeo]
Semana 8: Integrar el aprendizaje y la planificación [diapositiva][vídeo]
Semana 9: Exploración y Explotación [diapositiva][vídeo]
Semana 10: Estudio de caso: RL en juegos clásicos [diapositiva][vídeo]
Instálalos usando pip.
No dude en crear una solicitud de extracción para agregar implementaciones de los algoritmos analizados en diferentes marcos como PyTorch, Caffe, etc. o mejorar las implementaciones existentes. Si es principiante, puede consultar esto para comenzar.
Si esto le resultó útil, considere destacar (★) el repositorio para que pueda llegar a una audiencia más amplia.
Este proyecto tiene la licencia MIT; consulte el archivo de LICENCIA para obtener más detalles.