Este repositório contém as notas do curso Reinforcement Learning de David Silver, juntamente com a implementação dos vários algoritmos discutidos, tanto no Keras (com back-end do TensorFlow) quanto na estrutura de ginástica da OpenAI.
Semana 1: Introdução ao Aprendizado por Reforço [slide][vídeo]
Semana 2: Processos de decisão de Markov [slide][vídeo]
Semana 3: Planejamento por Programação Dinâmica [slide][vídeo]
Semana 4: Predição sem modelo [slide][vídeo]
Semana 5: Controle sem modelo [slide][vídeo]
Semana 6: Aproximação de Função de Valor [slide][vídeo]
Semana 7: Métodos de gradiente de política [slide][vídeo]
Semana 8: Integrando Aprendizagem e Planejamento [slide][vídeo]
Semana 9: Exploração e Exploração [slide][vídeo]
Semana 10: Estudo de caso: RL em jogos clássicos [slide][vídeo]
Instale-os usando pip.
Sinta-se à vontade para criar uma solicitação pull para adicionar implementações dos algoritmos discutidos em diferentes estruturas como PyTorch, Caffe, etc. ou melhorar as implementações existentes. Se você é iniciante, pode consultar isto para começar.
Se você achou isso útil, considere marcar o repositório com uma estrela (★) para que ele possa atingir um público mais amplo.
Este projeto está licenciado sob a licença MIT - consulte o arquivo LICENSE para obter detalhes.