Il s'agit d'une application basée sur Python qui effectue la classification des chiffres et le traitement du langage naturel sur l'ensemble de données MNIST et un ensemble de données de phrases anglais-allemand à l'aide de la bibliothèque Scikit-Learn et Tensorflow/Keras. L'application effectue également une analyse des résultats.
Lors de l'exécution de cette application, Scikit-Learn est nécessaire pour la classification des chiffres, Tensorflow et Keras sont nécessaires pour la section de traitement du langage naturel.
La compilation du code nécessite Python et un certain nombre de bibliothèques présentes dans le code. Utilisez le code suivant dans le terminal :
py DigitClassificationAndNLP.py
Les ensembles de formation, de validation et de test sont inclus dans les fichiers téléchargés.
Les 3 modèles entraînés dans la classification des chiffres sont : K-Nearest Neighbour, Random Decision Forest et Convolutional Neural Network.
Le modèle de traitement du langage naturel utilise le modèle LSTM fourni par Keras. Les 3 implémentations différentes ont un nombre variable de cachés de 256 à 1024.
Créé par Harrison Cattell, 2019