這是一個基於 Python 的應用程序,使用 Scikit-Learn 函式庫和 Tensorflow/Keras 對 MNIST 資料集和英德句子資料集進行數位分類和自然語言處理。
執行此應用程式時,數位分類需要 Scikit-Learn,自然語言處理部分需要 Tensorflow 和 Keras。
編譯程式碼需要 Python 和一些可以在程式碼中找到的函式庫。在終端機中使用以下程式碼:
py DigitClassificationAndNLP.py
訓練、驗證和測試集包含在下載的檔案中。
數位分類中訓練的 3 個模型是:K 最近鄰、隨機決策森林和卷積神經網路。
自然語言處理模型採用Keras提供的LSTM模型。 3 種不同的實作具有不同的隱藏數量,從 256 到 1024。
由哈里森卡特爾創作,2019 年