هذا تطبيق قائم على لغة بايثون ويقوم بتصنيف الأرقام ومعالجة اللغة الطبيعية على مجموعة بيانات MNIST ومجموعة بيانات من الجمل الإنجليزية-الألمانية باستخدام مكتبة Scikit-Learn وTensorflow/Keras. كما يقوم التطبيق أيضًا بتحليل النتائج
عند تشغيل هذا التطبيق، هناك حاجة إلى Scikit-Learn لتصنيف الأرقام، وهناك حاجة إلى Tensorflow وKeras لقسم معالجة اللغة الطبيعية.
يتطلب تجميع الكود لغة Python وعددًا من المكتبات التي يمكن العثور عليها في الكود. استخدم الكود التالي في المحطة:
py DigitClassificationAndNLP.py
يتم تضمين مجموعات التدريب والتحقق والاختبار ضمن الملفات التي تم تنزيلها.
النماذج الثلاثة التي تم تدريبها على تصنيف الأرقام هي: أقرب جار K، غابة القرار العشوائي، والشبكة العصبية التلافيفية.
يستخدم نموذج معالجة اللغة الطبيعية نموذج LSTM المقدم من Keras. تحتوي التطبيقات الثلاثة المختلفة على عدد متفاوت من العناصر المخفية من 256 إلى 1024.
تم الإنشاء بواسطة هاريسون كاتيل، 2019