Hierbei handelt es sich um eine Python-basierte Anwendung, die mithilfe der Scikit-Learn-Bibliothek und Tensorflow/Keras eine Ziffernklassifizierung und Verarbeitung natürlicher Sprache am MNIST-Datensatz und einem Datensatz englisch-deutscher Sätze durchführt. Die Anwendung führt auch eine Analyse der Ergebnisse durch
Beim Ausführen dieser Anwendung wird Scikit-Learn für die Ziffernklassifizierung, Tensorflow und Keras für den Abschnitt zur Verarbeitung natürlicher Sprache benötigt.
Zum Kompilieren des Codes sind Python und eine Reihe von Bibliotheken erforderlich, die im Code zu finden sind. Verwenden Sie im Terminal den folgenden Code:
py DigitClassificationAndNLP.py
Die Trainings-, Validierungs- und Testsätze sind in den heruntergeladenen Dateien enthalten.
Die drei in der Ziffernklassifizierung trainierten Modelle sind: K-Nearest Neighbour, Random Decision Forest und Convolutional Neural Network.
Das Modell zur Verarbeitung natürlicher Sprache verwendet das von Keras bereitgestellte LSTM-Modell. Die drei verschiedenen Implementierungen weisen eine unterschiedliche Anzahl versteckter Elemente auf, die zwischen 256 und 1024 liegt.
Erstellt von Harrison Cattell, 2019