Scikit-Learn 라이브러리와 Tensorflow/Keras를 사용하여 MNIST 데이터세트와 영어-독일어 문장 데이터세트에 대해 숫자 분류 및 자연어 처리를 수행하는 Python 기반 애플리케이션입니다. 또한 결과에 대한 분석도 수행하는 애플리케이션입니다.
이 애플리케이션을 실행할 때 숫자 분류에는 Scikit-Learn이 필요하고, 자연어 처리 섹션에는 Tensorflow와 Keras가 필요합니다.
코드를 컴파일하려면 Python과 코드에서 찾을 수 있는 여러 라이브러리가 필요합니다. 터미널에서 다음 코드를 사용하십시오.
py DigitClassificationAndNLP.py
훈련, 검증 및 테스트 세트는 다운로드한 파일에 포함되어 있습니다.
숫자 분류에서 훈련된 3가지 모델은 K-Nearest Neighbour, Random Decision Forest 및 Convolutional Neural Network입니다.
자연어 처리 모델은 Keras에서 제공하는 LSTM 모델을 사용합니다. 3가지 다른 구현에는 256에서 1024까지 다양한 숨겨진 수가 있습니다.
해리슨 카텔(Harrison Cattell) 제작, 2019년