David Silver Reinforcement learning
1.0.0
이 저장소에는 Keras(TensorFlow 백엔드 포함)와 OpenAI의 체육관 프레임워크에서 논의된 다양한 알고리즘의 구현과 함께 David Silver의 강화 학습 과정에 대한 노트가 포함되어 있습니다.
1주차: 강화 학습 소개 [슬라이드][동영상]
2주차: Markov 결정 프로세스 [슬라이드][동영상]
3주차: 동적 프로그래밍을 통한 계획 [슬라이드][동영상]
4주차: 모델 없는 예측 [슬라이드][동영상]
5주차: 모델 없는 제어 [슬라이드][동영상]
6주차: 가치 함수 근사 [슬라이드][동영상]
7주차: 정책 변화 방법 [슬라이드][동영상]
8주차: 학습 및 계획 통합 [슬라이드][동영상]
9주차: 탐색 및 활용 [슬라이드][동영상]
10주차: 사례 연구: 클래식 게임의 RL [슬라이드][동영상]
pip를 사용하여 설치하십시오.
PyTorch, Caffe 등과 같은 다양한 프레임워크에서 논의된 알고리즘의 구현을 추가하거나 기존 구현을 개선하기 위한 Pull Request를 자유롭게 생성해 주세요. 초보자라면 이 내용을 참조하여 시작하세요.
이 내용이 유용하다고 생각되면 더 많은 사용자에게 다가갈 수 있도록 저장소에 별표(★)를 표시해 보세요.
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 LICENSE 파일을 참조하세요.