تركز MindArmour على قضايا الأمان والخصوصية الخاصة بالذكاء الاصطناعي. ملتزمون بتعزيز أمان ومصداقية النماذج وحماية خصوصية بيانات المستخدمين. وهو يحتوي بشكل أساسي على 3 وحدات: وحدة قوة العينة العدائية، ووحدة اختبار الزغب، ووحدة حماية الخصوصية والتقييم.
تُستخدم وحدة متانة الأمثلة العدائية لتقييم متانة النموذج في مواجهة الأمثلة العدائية، وتوفر طرق تحسين النموذج لتعزيز قدرة النموذج على مقاومة هجمات الأمثلة العدائية وتحسين متانة النموذج. تحتوي وحدة قوة العينة العدائية على أربع وحدات فرعية: إنشاء عينات الخصومة، والكشف عن العينات العدائية، ونموذج الدفاع، وتقييم الهجوم والدفاع.
الرسم التخطيطي لوحدة قوة العينة العدائية هو كما يلي:
تعد وحدة اختبار Fuzz اختبارًا أمنيًا لنماذج الذكاء الاصطناعي، وفقًا لخصائص الشبكة العصبية، يتم تقديم تغطية الخلايا العصبية كدليل لاختبار Fuzz، وتوجيه Fuzzer لإنشاء عينات في اتجاه زيادة تغطية الخلايا العصبية، بحيث يتم إدخالها. يمكنه تنشيط المزيد من الخلايا العصبية، مع توزيع أوسع لقيم الخلايا العصبية لاختبار الشبكات العصبية بشكل كامل واستكشاف أنواع مختلفة من نتائج مخرجات النموذج والسلوكيات الخاطئة.
الرسم التخطيطي لوحدة اختبار Fuzz هو كما يلي
تتضمن وحدة حماية الخصوصية تدريبًا تفاضليًا على الخصوصية وتقييم تسرب الخصوصية.
يتضمن التدريب على الخصوصية التفاضلية أدوات تحسين الخصوصية التفاضلية الديناميكية أو غير الديناميكية SGD وMomentum وAdam. وتدعم آلية الضوضاء ضوضاء التوزيع الغاوسي ومراقبة ميزانية الخصوصية التفاضلية التي تتضمن ZCDP وRDP.
الرسم التخطيطي للخصوصية التفاضلية هو كما يلي
تُستخدم وحدة تقييم تسرب الخصوصية لتقييم مخاطر تسرب النموذج لخصوصية المستخدم. تُستخدم طريقة استنتاج العضوية لاستنتاج ما إذا كانت العينة تنتمي إلى مجموعة بيانات تدريب المستخدم لتقييم أمان بيانات الخصوصية لنموذج التعلم العميق.
الرسم التخطيطي لإطار عمل وحدة تقييم تسرب الخصوصية هو كما يلي: