Esta es una aplicación basada en Python que realiza clasificación de dígitos y procesamiento del lenguaje natural en el conjunto de datos MNIST y un conjunto de datos de oraciones inglés-alemán utilizando la biblioteca Scikit-Learn y Tensorflow/Keras. La aplicación también realiza análisis de los resultados.
Al ejecutar esta aplicación, se necesita Scikit-Learn para la clasificación de dígitos, Tensorflow y Keras para la sección de procesamiento del lenguaje natural.
Para compilar el código se requiere Python y varias bibliotecas que se pueden encontrar en el código. Utilice el siguiente código en la terminal:
py DigitClassificationAndNLP.py
Los conjuntos de capacitación, validación y prueba se incluyen en los archivos descargados.
Los 3 modelos entrenados en la clasificación de dígitos son: K-Vecino más cercano, Bosque de decisión aleatoria y Red neuronal convolucional.
El modelo de procesamiento del lenguaje natural utiliza el modelo LSTM proporcionado por Keras. Las 3 implementaciones diferentes tienen un número variable de ocultos, desde 256 hasta 1024.
Creado por Harrison Cattell, 2019