AI 기반 봇을 사용한 Checkers (Drafts) 전략 보드 게임 구현
이 프로젝트는 신경망이 체커 게임을하는 법을 배우는 능력을 보여주기위한 것입니다.
훈련 된 네트워크는 검색 알고리즘을 안내하는 데 사용됩니다 -Alpha -Beta 가지 치기로 Minimax
게임에서 가장 유망한 움직임을 선택합니다.
신경망은 보드 상태를 평가하는 데 사용되며, 보드 상태를 입력 및 -1과 1 사이의 출력 값으로 취합니다.
(값 -1-> 화이트 승리, 1-> 블랙 승리에 가까운 값). Alphazero는 이것을 "가치 네트워크"로 소개했습니다.
현재 신경망은 6 개의 숨겨진 레이어를 가진 MLP (다층 퍼셉트론) 모델입니다.
-> 32 입력 층을위한 뉴런 | 숨겨진 층의 경우 64, 64, 128, 128, 256, 256 및 출력 층의 경우 1 개의 뉴런
나는 MLP ATM보다 훨씬 더 좋아 보이는 시간적 차이 학습 방법 (TD Leaf)을 연구하고 있습니다.
(모델을 완전히 훈련하는 데 시간이 필요합니다).
주요 아이디어는 감독 학습을 사용하여 일부 모델을 훈련시킨 다음 자체 놀이로 해당 모델을 개선하는 것입니다.
-> http://www.fierz.ch/download.php
약 200000 게임의 결과는 대부분 드로잉 (약 14000)입니다. 신경망에는 그리 좋지 않지만 하나의 ATM을 더 잘 찾을 수 없습니다.
1. python main.py # runs web server on localhost:5000
2. Web browse to localhost:5000
At this phase game does not support (interface) validation and multiple jumps so dont use it right now :)
Console version is fully featured (it supports validation and multiple jumps)