Diese Arbeit zielt darauf ab, verschiedene Techniken des maschinellen Lernens zur Erkennung von Anomalien (einschließlich Hardwarefehlern, Sabotage und Cyberangriffen) in der SCADA-Wasserinfrastruktur einzusetzen.
Der verwendete Datensatz wird hier veröffentlicht
Wenn Sie den Artikel zitieren möchten, verwenden Sie bitte das folgende Format;
@InProceedings{10.1007/978-3-030-12786-2_1, author="Hindy, Hanan and Brosset, David and Bayne, Ethan and Seeam, Amar and Bellekens, Xavier", editor="Katsikas, Sokratis K. and Cuppens, Fr{'e}d{'e}ric and Cuppens, Nora and Lambrinoudakis, Costas and Ant{'o}n, Annie and Gritzalis, Stefanos and Mylopoulos, John and Kalloniatis, Christos", title="Improving SIEM for Critical SCADA Water Infrastructures Using Machine Learning", booktitle="Computer Security", year="2019", publisher="Springer International Publishing", address="Cham", pages="3--19" }
Logistische Regression
Gaußscher naiver Bayes
k-Nächste Nachbarn
Unterstützt Vektormaschine
Entscheidungsbäume
Zufällige Wälder
Clone this repository run preprocessing.py [dataset log path] run classification.py [data processed file path] run classification-with-confidence.py [data processed file path]
Die Ausgabe der Vorverarbeitung wird im geklonten Verzeichnis als „dataset_processed.csv“ gespeichert.
Die Klassifizierungsausgaben sind für jede Ausgabe (Anomalie, betroffene Komponente, Szenario usw.) in Ordner unterteilt. Jeder Ordner enthält eine CSV-Datei für jeden Algorithmus mit seiner Verwirrungsmatrix und eine Datei „CrossValidation.csv“ mit den kombinierten Ergebnissen.