MindArmour berfokus pada masalah keamanan dan privasi AI. Berkomitmen untuk meningkatkan keamanan dan kredibilitas model serta melindungi privasi data pengguna. Ini terutama berisi 3 modul: modul ketahanan sampel permusuhan, modul Pengujian Fuzz, dan modul perlindungan privasi dan evaluasi.
Modul ketahanan contoh permusuhan digunakan untuk mengevaluasi ketahanan model terhadap contoh-contoh permusuhan, dan menyediakan metode peningkatan model untuk meningkatkan kemampuan model dalam menahan serangan contoh permusuhan dan meningkatkan ketahanan model. Modul ketahanan sampel permusuhan berisi empat sub-modul: pembuatan sampel permusuhan, deteksi sampel permusuhan, pertahanan model, dan evaluasi serangan dan pertahanan.
Diagram arsitektur modul ketahanan sampel adversarial adalah sebagai berikut:
Modul Pengujian Fuzz adalah pengujian keamanan untuk model AI. Sesuai dengan karakteristik jaringan saraf, cakupan neuron diperkenalkan sebagai panduan untuk pengujian Fuzz, memandu Fuzzer untuk menghasilkan sampel ke arah peningkatan cakupan neuron, sehingga masukannya dapat diperoleh. dapat mengaktifkan lebih banyak Neuron, dengan distribusi nilai neuron yang lebih luas untuk sepenuhnya menguji jaringan saraf dan mengeksplorasi berbagai jenis hasil keluaran model dan perilaku yang salah.
Diagram arsitektur modul Fuzz Testing adalah sebagai berikut
Modul perlindungan privasi mencakup pelatihan privasi diferensial dan penilaian kebocoran privasi.
Pelatihan privasi diferensial mencakup pengoptimal privasi diferensial dinamis atau non-dinamis, Momentum, dan Adam. Mekanisme kebisingan mendukung kebisingan distribusi Gaussian dan kebisingan distribusi Laplace.
Diagram arsitektur privasi diferensial adalah sebagai berikut
Modul penilaian kebocoran privasi digunakan untuk mengevaluasi risiko model membocorkan privasi pengguna. Metode inferensi keanggotaan digunakan untuk menyimpulkan apakah sampel termasuk dalam kumpulan data pelatihan pengguna untuk mengevaluasi keamanan data privasi model pembelajaran mendalam.
Diagram kerangka modul penilaian kebocoran privasi adalah sebagai berikut: