MindArmour фокусируется на вопросах безопасности и конфиденциальности ИИ. Мы стремимся повысить безопасность и надежность моделей, а также защитить конфиденциальность данных пользователей. В основном он содержит 3 модуля: модуль устойчивости состязательных образцов, модуль нечеткого тестирования и модуль защиты и оценки конфиденциальности.
Модуль устойчивости состязательных примеров используется для оценки устойчивости модели к состязательным примерам и предоставляет методы улучшения модели для повышения способности модели противостоять атакам состязательных примеров и повышения надежности модели. Модуль устойчивости состязательных образцов содержит четыре подмодуля: создание состязательных образцов, обнаружение состязательных образцов, защита модели и оценка атаки и защиты.
Схема архитектуры модуля устойчивости к состязательным образцам выглядит следующим образом:
Модуль Fuzz Testing — это тест безопасности для моделей ИИ. В соответствии с характеристиками нейронной сети в качестве руководства для Fuzz-тестирования вводится покрытие нейронов, которое направляет фаззер на создание выборок в направлении увеличения покрытия нейронов, чтобы входные данные были улучшены. может активировать больше нейронов с более широким распределением значений нейронов для полного тестирования нейронных сетей и исследования различных типов выходных результатов модели и ошибочного поведения.
Архитектурная схема модуля Fuzz Testing выглядит следующим образом.
Модуль защиты конфиденциальности включает в себя дифференцированное обучение конфиденциальности и оценку утечки конфиденциальной информации.
Обучение дифференциальной конфиденциальности включает динамические или нединамические оптимизаторы дифференциальной конфиденциальности SGD, Momentum и Adam. Механизм шума поддерживает шум распределения Гаусса и шум распределения Лапласа. Мониторинг бюджета дифференциальной конфиденциальности включает ZCDP и RDP.
Схема архитектуры дифференциальной конфиденциальности выглядит следующим образом.
Модуль оценки утечки конфиденциальной информации используется для оценки риска утечки конфиденциальной информации пользователя из модели. Метод вывода о членстве используется для вывода о том, принадлежит ли образец набору данных обучения пользователей, чтобы оценить безопасность данных конфиденциальности модели глубокого обучения.
Структурная схема модуля оценки утечки конфиденциальной информации выглядит следующим образом: