Это приложение на основе Python, которое выполняет классификацию цифр и обработку естественного языка в наборе данных MNIST и наборе данных англо-немецких предложений с использованием библиотеки Scikit-Learn и Tensorflow/Keras. Приложение также выполняет анализ результатов.
При запуске этого приложения Scikit-Learn необходим для классификации цифр, Tensorflow и Keras необходимы для раздела обработки естественного языка.
Для компиляции кода требуется Python и ряд библиотек, которые можно найти в коде. Используйте следующий код в терминале:
py DigitClassificationAndNLP.py
Наборы для обучения, проверки и тестирования включены в загруженные файлы.
Три модели, обученные классификации цифр: K-ближайший сосед, лес случайных решений и сверточная нейронная сеть.
Модель обработки естественного языка использует модель LSTM, предоставленную Keras. Три различные реализации имеют разное количество скрытых значений от 256 до 1024.
Создано Харрисоном Кеттеллом, 2019 г.