Ce travail vise à utiliser différentes techniques d'apprentissage automatique pour détecter les anomalies (y compris les pannes matérielles, le sabotage et les cyberattaques) dans les infrastructures d'eau SCADA.
L'ensemble de données utilisé est publié ici
Si vous souhaitez citer l'article, veuillez utiliser le format suivant :
@InProceedings{10.1007/978-3-030-12786-2_1, author="Hindy, Hanan and Brosset, David and Bayne, Ethan and Seeam, Amar and Bellekens, Xavier", editor="Katsikas, Sokratis K. and Cuppens, Fr{'e}d{'e}ric and Cuppens, Nora and Lambrinoudakis, Costas and Ant{'o}n, Annie and Gritzalis, Stefanos and Mylopoulos, John and Kalloniatis, Christos", title="Improving SIEM for Critical SCADA Water Infrastructures Using Machine Learning", booktitle="Computer Security", year="2019", publisher="Springer International Publishing", address="Cham", pages="3--19" }
Régression logistique
Bayes naïf gaussien
k-Voisins les plus proches
Machine à vecteurs de support
Arbres de décision
Forêts aléatoires
Clone this repository run preprocessing.py [dataset log path] run classification.py [data processed file path] run classification-with-confidence.py [data processed file path]
La sortie du prétraitement sera enregistrée dans le répertoire cloné sous le nom « dataset_processed.csv »
Les sorties de classification sont séparées dans des dossiers pour chaque sortie (anomalie, composant concerné, scénario, etc.). Chaque dossier contient un csv pour chaque algorithme ayant sa matrice de confusion et un fichier 'CrossValidation.csv' avec les résultats combinés.