Presidio - SDK Perlindungan Data dan De-identifikasi
Layanan de-identifikasi PII yang sadar konteks, dapat dipasang, dan dapat disesuaikan untuk teks dan gambar.
- Penganalisis Presidio
- Presidio Anonimizer
- Redaktor Gambar Presidio
- Presidio Terstruktur
Apa itu Presidio
Presidio (Asal dari bahasa Latin presidium 'perlindungan, garnisun') membantu memastikan data sensitif dikelola dan diatur dengan benar. Ini menyediakan modul identifikasi dan anonimisasi cepat untuk entitas swasta dalam teks seperti nomor kartu kredit, nama, lokasi, nomor jaminan sosial, dompet bitcoin, nomor telepon AS, data keuangan, dan banyak lagi.
![GIF demo Presidio](https://images.downcodes.com/uploads/20241212/img_6759f0aa1a8a530.png)
Dokumentasi lengkap
❓ Pertanyaan yang Sering Diajukan
? Demo
? Contoh
Apakah Anda menggunakan Presidio? Kami ingin tahu caranya
Tolong bantu kami meningkatkan kualitas dengan mengikuti survei singkat anonim ini.
Sasaran
- Izinkan organisasi untuk menjaga privasi dengan cara yang lebih sederhana dengan mendemokratisasi teknologi de-identifikasi dan memperkenalkan transparansi dalam pengambilan keputusan.
- Merangkul kemampuan untuk diperluas dan disesuaikan dengan kebutuhan bisnis tertentu.
- Memfasilitasi alur de-identifikasi PII yang sepenuhnya otomatis dan semi-otomatis di berbagai platform.
Fitur utama
- Pengenal PII yang telah ditentukan sebelumnya atau khusus memanfaatkan Pengenalan Entitas Bernama , ekspresi reguler , logika berbasis aturan , dan checksum dengan konteks yang relevan dalam berbagai bahasa.
- Opsi untuk menyambung ke model deteksi PII eksternal.
- Berbagai opsi penggunaan, mulai dari beban kerja Python atau PySpark melalui Docker hingga Kubernetes .
- Kemampuan penyesuaian dalam identifikasi dan de-identifikasi PII.
- Modul untuk menyunting teks PII dalam gambar (tipe gambar standar dan gambar medis DICOM).
️ Presidio dapat membantu mengidentifikasi data sensitif/PII dalam teks tidak/terstruktur. Namun, karena menggunakan mekanisme deteksi otomatis, tidak ada jaminan bahwa Presidio akan menemukan semua informasi sensitif. Oleh karena itu, sistem dan perlindungan tambahan harus diterapkan.
Menginstal Presidio
- Menggunakan pip
- Menggunakan Docker
- Dari sumber
- Bermigrasi dari V1 ke V2
Menjalankan Presidio
- Memulai
- Menyiapkan lingkungan pengembangan
- De-identifikasi PII dalam teks
- De-identifikasi PII dalam gambar
- Sampel penggunaan dan contoh penerapan
Mendukung
- Sebelum Anda mengirimkan masalah, harap periksa dokumentasinya.
- Untuk diskusi umum, silakan gunakan papan diskusi repo Github.
- Jika Anda memiliki pertanyaan penggunaan, menemukan bug, atau memiliki saran perbaikan, silakan ajukan masalah Github.
- Untuk masalah lainnya, silakan kirim email ke [email protected].
Berkontribusi
Untuk detail tentang berkontribusi pada repositori ini, lihat panduan berkontribusi.
Proyek ini menyambut baik kontribusi dan saran. Sebagian besar kontribusi mengharuskan Anda menyetujui Perjanjian Lisensi Kontributor (CLA) yang menyatakan bahwa Anda berhak, dan memang benar, memberi kami hak untuk menggunakan kontribusi Anda. Untuk detailnya, kunjungi https://cla.microsoft.com.
Saat Anda mengirimkan permintaan tarik, bot CLA akan secara otomatis menentukan apakah Anda perlu memberikan CLA dan menghias PR dengan tepat (misalnya, label, komentar). Cukup ikuti instruksi yang diberikan oleh bot. Anda hanya perlu melakukan ini sekali di seluruh repo menggunakan CLA kami.
Proyek ini telah mengadopsi Kode Etik Sumber Terbuka Microsoft. Untuk informasi lebih lanjut lihat FAQ Pedoman Perilaku atau hubungi [email protected] jika ada pertanyaan atau komentar tambahan.
Kontributor