Presidio - SDK de protection des données et de désidentification
Service de désidentification des informations personnelles contextuelles, enfichable et personnalisable pour le texte et les images.
- Analyseur Presidio
- Anonymiseur Presidio
- Presidio Image-Rédacteur
- Présidio structuré
Qu'est-ce que le Presidio
Presidio (Origine du latin praesidium « protection, garnison ») contribue à garantir que les données sensibles sont correctement gérées et gouvernées. Il fournit des modules d'identification et d'anonymisation rapides pour les entités privées dans des textes tels que des numéros de carte de crédit, des noms, des emplacements, des numéros de sécurité sociale, des portefeuilles Bitcoin, des numéros de téléphone américains, des données financières et bien plus encore.
Documentation complète
❓ Questions fréquemment posées
? Démo
? Exemples
Utilisez-vous Presidio ? Nous aimerions savoir comment
Aidez-nous à nous améliorer en répondant à ce court sondage anonyme.
Objectifs
- Permettez aux organisations de préserver la confidentialité de manière plus simple en démocratisant les technologies de désidentification et en introduisant la transparence dans les décisions.
- Adoptez l’extensibilité et la personnalisation en fonction d’un besoin commercial spécifique.
- Facilitez les flux de désidentification des informations personnelles entièrement automatisés et semi-automatisés sur plusieurs plates-formes.
Principales caractéristiques
- Dispositifs de reconnaissance PII prédéfinis ou personnalisés exploitant la reconnaissance d'entités nommées , les expressions régulières , la logique basée sur des règles et la somme de contrôle avec un contexte pertinent dans plusieurs langues.
- Options de connexion à des modèles de détection PII externes.
- Plusieurs options d'utilisation, des charges de travail Python ou PySpark en passant par Docker et Kubernetes .
- Personnalisation de l'identification et de la désidentification des informations personnelles.
- Module de rédaction de texte PII dans les images (types d'images standard et images médicales DICOM).
️ Presidio peut aider à identifier les données sensibles/PII dans du texte non/structuré. Cependant, comme il utilise des mécanismes de détection automatisés, rien ne garantit que Presidio trouvera toutes les informations sensibles. Par conséquent, des systèmes et des protections supplémentaires doivent être utilisés.
Installation de Presidio
- Utiliser pip
- Utiliser Docker
- De la source
- Migration de la V1 vers la V2
Exécution du Presidio
- Commencer
- Mise en place d'un environnement de développement
- Désidentification des informations personnelles dans le texte
- Désidentification des informations personnelles dans les images
- Exemples d'utilisation et exemples de déploiements
Soutien
- Avant de soumettre un problème, veuillez consulter la documentation.
- Pour les discussions générales, veuillez utiliser le forum de discussion du dépôt Github.
- Si vous avez une question d'utilisation, avez trouvé un bug ou avez une suggestion d'amélioration, veuillez signaler un problème Github.
- Pour d'autres questions, veuillez envoyer un e-mail à [email protected].
Contribuer
Pour plus de détails sur la contribution à ce référentiel, consultez le guide de contribution.
Ce projet accueille les contributions et suggestions. La plupart des contributions nécessitent que vous acceptiez un contrat de licence de contributeur (CLA) déclarant que vous avez le droit de nous accorder, et que vous nous accordez effectivement, le droit d'utiliser votre contribution. Pour plus de détails, visitez https://cla.microsoft.com.
Lorsque vous soumettez une pull request, un robot CLA déterminera automatiquement si vous devez fournir un CLA et décorera le PR de manière appropriée (par exemple, étiquette, commentaire). Suivez simplement les instructions fournies par le bot. Vous n’aurez besoin de le faire qu’une seule fois pour tous les dépôts utilisant notre CLA.
Ce projet a adopté le code de conduite Microsoft Open Source. Pour plus d’informations, consultez la FAQ sur le code de conduite ou contactez [email protected] pour toute question ou commentaire supplémentaire.
Contributeurs