Обнаружение угроз в кибербезопасности с использованием искусственного интеллекта
Обзор
Проект «Обнаружение угроз в кибербезопасности с использованием ИИ» направлен на разработку системы обнаружения угроз с использованием алгоритмов машинного обучения. Проект состоит из нескольких шагов, каждый из которых способствует общей цели повышения кибербезопасности. Вот обзор каждого шага:
Шаг 1: Предварительная обработка данных (предварительная обработка.
- Этот шаг включает в себя предварительную обработку данных для подготовки набора данных для машинного обучения.
- Используемый набор данных представляет собой набор данных CIC-ID2017, который следует хранить в папке «CSVS», расположенной в том же каталоге, что и в программе.
- Вы можете получить доступ к файлам набора данных здесь.
Шаг 2: Фильтрация данных атаки (attastDivision.ipynb)
- На этом этапе программа использует файл "all_data.csv" для создания файлов, специфичных для атаки.
- Эти файлы атаки затем сохраняются в каталоге «./attacks/» для дальнейшего анализа.
- Набор данных содержит в общей сложности 12 типов атак, и этот шаг отделяет их для индивидуального обследования.
Шаг 3: Выбор функции и машинное обучение (featuresElection.ipynb)
- Этот шаг фокусируется на выборе функций для файлов атаки, созданных на шаге 2.
- Программа идентифицирует четыре функции с самым высоким весом для каждого файла.
- Эти выбранные функции используются в качестве входных данных для алгоритмов машинного обучения.
Шаг 4: Оценка алгоритма машинного обучения (MachineLearningSep.ipynb)
- Последний шаг применяет семь алгоритмов машинного обучения к каждому файлу атаки несколько раз для надежной оценки.
- Результаты этих операций отображаются на экране и сохраняются в файле "./attacks/results_1.csv".
- Кроме того, сгенерированы результаты, представляющие результаты.
- Как графика, так и результаты сохраняются в папке "./attacks/result_graph_1/".
Источник набора данных
Вы можете получить доступ к набору данных CIC-ID2017 здесь.