这是一个基于 Python 的应用程序,使用 Scikit-Learn 库和 Tensorflow/Keras 对 MNIST 数据集和英德句子数据集进行数字分类和自然语言处理。该应用程序还对结果进行分析
运行此应用程序时,数字分类需要 Scikit-Learn,自然语言处理部分需要 Tensorflow 和 Keras。
编译代码需要 Python 和一些可以在代码中找到的库。在终端中使用以下代码:
py DigitClassificationAndNLP.py
训练、验证和测试集包含在下载的文件中。
数字分类中训练的 3 个模型是:K 最近邻、随机决策森林和卷积神经网络。
自然语言处理模型采用Keras提供的LSTM模型。 3 种不同的实现具有不同的隐藏数量,从 256 到 1024。
由哈里森·卡特尔创作,2019 年