텍스트 분류는 텍스트를 범주로 스마트하게 분류하는 것입니다. 그리고 기계 학습을 사용하여 이러한 작업을 자동화하면 전체 프로세스가 매우 빠르고 효율적이 됩니다. 인공 지능과 기계 학습은 틀림없이 최근 추진력을 얻은 가장 유익한 기술입니다.
이는 3000행의 메시지 세트로 훈련된 모델일 뿐입니다. 웹 애플리케이션과 함께 작동할 수 있도록 통합 단계가 있습니다. 현재 우리는 데이터세트를 .tsv 파일에 저장하고 있습니다. 이는 모델을 훈련하기 위해 선택한 알고리즘과 잘 작동하기 때문입니다.
Visual Studio Nuget 패키지:Microsoft ML.NET
유추된 튜플 요소 이름은 C# 7.1의 새로운 기능이고 프로젝트의 기본 언어 버전은 C# 7.0이므로 언어 버전을 C# 7.1 이상으로 변경해야 합니다. 이렇게 하려면 솔루션 탐색기에서 프로젝트 노드를 마우스 오른쪽 단추로 클릭하고 속성을 선택합니다. 빌드 탭을 선택하고 고급 버튼을 선택합니다. 드롭다운에서 C# 7.1(또는 상위 버전)을 선택합니다. 확인 버튼을 선택합니다.
Project ->Properties ->Build->Advanced->Language Version->C# 7.1
현재는 콘솔 애플리케이션이므로 콘솔 창에서 실행하여 모델 학습, 평가 및 예측에 대한 정보를 얻을 수 있습니다.
적절한 데이터 세트를 사용하여 한 번만 훈련할 수 있으며 애플리케이션 내부의 데이터 폴더에 .Zip 형식으로 저장됩니다. 테스트는 모델 예측 결과의 정확한 정확성에 대해 말할 수 있습니다. 배포는 주어진 테스트 데이터의 실제 예측 단계입니다.
이 모델은 메시지 카테고리를 예측하기 위해 애플리케이션 내에서 웹 API로 사용될 수 있습니다.
카테고리를 감지하기 위해 30000개의 메시지로 훈련된 마이너 모델 카테고리 및 하위 카테고리를 감지하기 위해 대규모 데이터세트로 훈련된 메이저 모델
기여자 - 프로젝트 아이디어 Fred