テキスト分類は、テキストをカテゴリにスマートに分類します。そして、機械学習を使用してこれらのタスクを自動化することで、プロセス全体が超高速かつ効率的に行われます。人工知能と機械学習は、おそらく最近勢いを増した最も有益なテクノロジーです。
これは、3000 行のメッセージのセットでトレーニングされた単なるモデルです。統合フェーズは、Web アプリケーションと連携させるためにあります。現時点では、データセットを .tsv ファイルに保存しています。これは、モデルをトレーニングするために選択したアルゴリズムとうまく機能するためです。
Visual Studio Nuget パッケージ:microsoft ML.NET
推論されたタプル要素名は C# 7.1 の新機能であり、プロジェクトのデフォルトの言語バージョンは C# 7.0 であるため、言語バージョンを C# 7.1 以降に変更する必要があります。これを行うには、ソリューション エクスプローラーでプロジェクト ノードを右クリックし、[プロパティ] を選択します。 「ビルド」タブを選択し、「詳細」ボタンを選択します。ドロップダウンで、C# 7.1 (またはそれ以降のバージョン) を選択します。 [OK]ボタンを選択します。
Project ->Properties ->Build->Advanced->Language Version->C# 7.1
現時点ではコンソール アプリケーションなので、コンソール ウィンドウで実行するだけで、モデルのトレーニング、評価、予測に関する情報を取得できます。
適切なデータセットを使用してトレーニングできるのは 1 回のみで、データセットはアプリケーション内のデータ フォルダーに .Zip 形式で保存されます。テストでは、モデルの予測結果の正確な精度を判断できます。 デプロイメントは、特定のテスト データの実際の予測フェーズです。
このモデルは、メッセージのカテゴリを予測するためにアプリケーション内の Web API として使用できます。
カテゴリを検出するために 30,000 のメッセージでトレーニングされたマイナー モデル カテゴリとサブカテゴリを検出するために大規模なデータセットでトレーニングされたメジャー モデル
寄稿者-プロジェクトのアイデアFred