checkers game 다운로드 - checkers game 소스 코드 다운로드

checkers game

기타 소스코드

다운로드

체커 게임

AI 기반 봇을 사용한 Checkers (Drafts) 전략 보드 게임 구현

확인하다

이 프로젝트는 신경망이 체커 게임을하는 법을 배우는 능력을 보여주기위한 것입니다.
훈련 된 네트워크는 검색 알고리즘을 안내하는 데 사용됩니다 -Alpha -Beta 가지 치기로 Minimax
게임에서 가장 유망한 움직임을 선택합니다.

신경망은 보드 상태를 평가하는 데 사용되며, 보드 상태를 입력 및 -1과 1 사이의 출력 값으로 취합니다.
(값 -1-> 화이트 승리, 1-> 블랙 승리에 가까운 값). Alphazero는 이것을 "가치 네트워크"로 소개했습니다.

현재 신경망은 6 개의 숨겨진 레이어를 가진 MLP (다층 퍼셉트론) 모델입니다.
-> 32 입력 층을위한 뉴런 | 숨겨진 층의 경우 64, 64, 128, 128, 256, 256 및 출력 층의 경우 1 개의 뉴런

나는 MLP ATM보다 훨씬 더 좋아 보이는 시간적 차이 학습 방법 (TD Leaf)을 연구하고 있습니다.
(모델을 완전히 훈련하는 데 시간이 필요합니다).

주요 아이디어는 감독 학습을 사용하여 일부 모델을 훈련시킨 다음 자체 놀이로 해당 모델을 개선하는 것입니다.

교육에 사용되는 데이터 세트

-> http://www.fierz.ch/download.php

약 200000 게임의 결과는 대부분 드로잉 (약 14000)입니다. 신경망에는 그리 좋지 않지만 하나의 ATM을 더 잘 찾을 수 없습니다.

요구 사항

파이썬 3
파이썬 체스
플라스크
Numpy
Pytorch

용법

 1. python main.py  # runs web server on localhost:5000
2. Web browse to localhost:5000

At this phase game does not support (interface) validation and multiple jumps so dont use it right now :)
Console version is fully featured (it supports validation and multiple jumps)

참조

데이터 세트 -> http://www.fierz.ch/download.php
형식 -> http://www.bobnewell.net/filez/reinfeld2ndedition.pdf
ML 업데이트 -> http://www.bobnewell.net/nucleus/checkers.php?itemid=1177
td-> https://www.researchgate.net/publication/221185124_temporal_difference_beptroach_to_playing_give-away_checkers
td-> http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.80.6366&rep=rep1&type=pdf
https://www.researchgate.net/publication/3302690_neural_networks_to_play_checkers_without_expert_knowledge

확장하다

추가 정보