AIを使用したサイバーセキュリティにおける脅威検出
概要
「AIを使用したサイバーセキュリティの脅威検出」プロジェクトは、機械学習アルゴリズムを使用した脅威検出システムを開発することを目的としています。このプロジェクトはいくつかのステップで構成されており、それぞれがサイバーセキュリティを強化するという全体的な目標に貢献しています。各ステップの概要は次のとおりです。
ステップ1:データプリプロセシング(Preprocessing.ipynb)
- このステップでは、データセットを機械学習用に準備するためのデータ前処理が含まれます。
- 使用されるデータセットはCIC-IDS2017データセットです。これは、プログラムと同じディレクトリにある「CSVS」フォルダーに保存する必要があります。
- ここからデータセットファイルにアクセスできます。
ステップ2:攻撃データフィルタリング(astationDivision.ipynb)
- このステップでは、プログラムは「all_data.csv」ファイルを使用して攻撃固有のファイルを作成します。
- これらの攻撃ファイルは、さらに分析するために「./attacks/」ディレクトリに保存されます。
- データセットには合計12の攻撃タイプが含まれており、このステップでは個々の検査のためにそれらを分離します。
ステップ3:機能の選択と機械学習(featureSelection.ipynb)
- このステップでは、ステップ2で作成された攻撃ファイルの機能選択に焦点を当てています。
- このプログラムは、各ファイルで最高の重みの4つの機能を識別します。
- これらの選択された機能は、機械学習アルゴリズムの入力として使用されます。
ステップ4:機械学習アルゴリズムの評価(MachinElearningsep.ipynb)
- 最後のステップでは、堅牢な評価のために、各攻撃ファイルに7つの機械学習アルゴリズムを適用します。
- これらの操作の結果は画面に表示され、ファイル「./attacks/results_1.csv」に保存されます。
- さらに、結果を表すボックスとウィスカグラフィックが生成されます。
- グラフィックと結果の両方が「./attacks/result_graph_1/」フォルダーに保存されます。
データセットソース
ここからCIC-IDS2017データセットにアクセスできます。