Mise en œuvre du jeu de plateau de stratégie des dames (brouillons) avec bot basé sur l'IA
Ce projet est destiné à mettre en valeur la capacité des réseaux de neurones à apprendre à jouer à un jeu de vérificateurs.
Le réseau formé est utilisé pour guider un algorithme de recherche - Minimax avec élagage alpha-bêta
Pour sélectionner les mouvements les plus prometteurs dans les jeux.
Le réseau neuronal est utilisé pour évaluer l'état de la carte, il prend l'état de la carte en tant qu'entrée et la valeur des sorties entre -1 et 1
(valeurs proches de -1 -> victoires blanches, valeurs près de 1 -> victoires noires). Alphazero a introduit cela comme "réseau de valeur".
Actuellement, le réseau neuronal n'est que le modèle MLP (multicouche perceptron) avec 6 couches cachées:
-> 32 neurones pour la couche d'entrée | 64, 64, 128, 128, 256, 256 pour les couches cachées et 1 neurone pour la couche de sortie
Je travaille sur la méthode d'apprentissage de la différence temporelle (TD Leaf) qui semble bien mieux que MLP ATM
(Besoin d'un peu de temps pour s'entretenir complètement le modèle).
L'idée principale est d'utiliser l'apprentissage supervisé pour (pré) former un modèle, puis d'améliorer ce modèle avec l'auto-play, ce que DeepMind a fait avec Alphazero.
-> http://www.fierz.ch/download.php
Environ 20000 jeux, les résultats sont principalement des tirages (environ 14000) - pas si parfaits pour les filets neuronaux, mais je ne trouve pas un meilleur ATM.
1. python main.py # runs web server on localhost:5000
2. Web browse to localhost:5000
At this phase game does not support (interface) validation and multiple jumps so dont use it right now :)
Console version is fully featured (it supports validation and multiple jumps)