Este trabajo tiene como objetivo utilizar diferentes técnicas de aprendizaje automático para detectar anomalías (incluidos fallos de hardware, sabotajes y ciberataques) en la infraestructura hídrica SCADA.
El conjunto de datos utilizado se publica aquí.
Si desea citar el artículo, utilice el siguiente formato;
@InProceedings{10.1007/978-3-030-12786-2_1, author="Hindy, Hanan and Brosset, David and Bayne, Ethan and Seeam, Amar and Bellekens, Xavier", editor="Katsikas, Sokratis K. and Cuppens, Fr{'e}d{'e}ric and Cuppens, Nora and Lambrinoudakis, Costas and Ant{'o}n, Annie and Gritzalis, Stefanos and Mylopoulos, John and Kalloniatis, Christos", title="Improving SIEM for Critical SCADA Water Infrastructures Using Machine Learning", booktitle="Computer Security", year="2019", publisher="Springer International Publishing", address="Cham", pages="3--19" }
Regresión logística
Bayes ingenuo gaussiano
k-vecinos más cercanos
Máquina de vectores de soporte
Árboles de decisión
Bosques aleatorios
Clone this repository run preprocessing.py [dataset log path] run classification.py [data processed file path] run classification-with-confidence.py [data processed file path]
El resultado del preprocesamiento se guardará en el directorio clonado como 'dataset_processed.csv'
La clasificación de las salidas está separada en carpetas para cada salida (anomalía, componente afectado, escenario, etc.). Cada carpeta contiene un csv para cada algoritmo que tiene su matriz de confusión y un archivo 'CrossValidation.csv' con los resultados combinados.