machine learning SIEM water infrastructure
1.0.0
이 작업은 SCADA 수자원 인프라에서 이상 현상(하드웨어 오류, 방해 행위 및 사이버 공격 포함)을 탐지하는 데 다양한 기계 학습 기술을 사용하는 것을 목표로 합니다.
사용된 데이터 세트는 여기에 게시됩니다.
논문을 인용하려면 다음 형식을 사용하세요.
@InProceedings{10.1007/978-3-030-12786-2_1, author="Hindy, Hanan and Brosset, David and Bayne, Ethan and Seeam, Amar and Bellekens, Xavier", editor="Katsikas, Sokratis K. and Cuppens, Fr{'e}d{'e}ric and Cuppens, Nora and Lambrinoudakis, Costas and Ant{'o}n, Annie and Gritzalis, Stefanos and Mylopoulos, John and Kalloniatis, Christos", title="Improving SIEM for Critical SCADA Water Infrastructures Using Machine Learning", booktitle="Computer Security", year="2019", publisher="Springer International Publishing", address="Cham", pages="3--19" }
로지스틱 회귀
가우스 나이브 베이즈
k-최근접이웃
서포트 벡터 머신
의사결정 트리
랜덤 포레스트
Clone this repository run preprocessing.py [dataset log path] run classification.py [data processed file path] run classification-with-confidence.py [data processed file path]
전처리 결과는 복제된 디렉터리에 'dataset_processed.csv'로 저장됩니다.
분류 출력은 각 출력(이상, 영향을 받은 구성 요소, 시나리오 등)에 대한 폴더로 구분됩니다. 각 폴더에는 혼동 행렬이 있는 각 알고리즘에 대한 csv와 결합된 결과가 포함된 'CrossValidation.csv' 파일이 포함되어 있습니다.