Presidio - SDK de protección de datos y desidentificación
Servicio de desidentificación de PII sensible al contexto, conectable y personalizable para texto e imágenes.
- Analizador de Presidio
- Anonimizador de Presidio
- Presidio Imagen-Redactor
- Presidio estructurado
que es presidio
Presidio (origen del latín praesidium 'protección, guarnición') ayuda a garantizar que los datos confidenciales se gestionen y gobiernen adecuadamente. Proporciona módulos de identificación rápida y anonimización para entidades privadas en texto, como números de tarjetas de crédito, nombres, ubicaciones, números de seguridad social, billeteras bitcoin, números de teléfono de EE. UU., datos financieros y más.
Documentación completa
❓ Preguntas frecuentes
? Manifestación
? Ejemplos
¿Estás usando Presidio? Nos encantaría saber cómo
Ayúdenos a mejorar respondiendo esta breve encuesta anónima.
Objetivos
- Permitir que las organizaciones preserven la privacidad de una manera más sencilla democratizando las tecnologías de desidentificación e introduciendo transparencia en las decisiones.
- Adopte la extensibilidad y la personalización según una necesidad empresarial específica.
- Facilite flujos de desidentificación de PII totalmente automatizados y semiautomáticos en múltiples plataformas.
Características principales
- Reconocedores de PII predefinidos o personalizados que aprovechan el reconocimiento de entidades nombradas , expresiones regulares , lógica basada en reglas y suma de verificación con contexto relevante en varios idiomas.
- Opciones para conectarse a modelos de detección de PII externos.
- Múltiples opciones de uso, desde cargas de trabajo Python o PySpark pasando por Docker hasta Kubernetes .
- Personalización en la identificación y desidentificación de PII.
- Módulo para redactar texto PII en imágenes (tipos de imágenes estándar e imágenes médicas DICOM).
️ Presidio puede ayudar a identificar datos confidenciales/PII en texto no estructurado. Sin embargo, debido a que utiliza mecanismos de detección automatizados, no hay garantía de que Presidio encuentre toda la información confidencial. En consecuencia, se deben emplear sistemas y protecciones adicionales.
Instalación de Presidio
- Usando pepita
- Usando ventana acoplable
- De la fuente
- Migrar de V1 a V2
Presidio corriendo
- Empezando
- Configurar un entorno de desarrollo
- Desidentificación de PII en texto
- Desidentificación de PII en imágenes
- Ejemplos de uso e implementaciones de ejemplo
Apoyo
- Antes de enviar un problema, revise la documentación.
- Para discusiones generales, utilice el foro de discusión del repositorio de Github.
- Si tiene una pregunta sobre el uso, encontró un error o tiene una sugerencia para mejorar, presente un problema de Github.
- Para otros asuntos, envíe un correo electrónico a [email protected].
Contribuyendo
Para obtener detalles sobre cómo contribuir a este repositorio, consulte la guía de contribución.
Este proyecto agradece contribuciones y sugerencias. La mayoría de las contribuciones requieren que usted acepte un Acuerdo de licencia de colaborador (CLA) que declara que tiene derecho a otorgarnos, y de hecho lo hace, los derechos para usar su contribución. Para obtener más detalles, visite https://cla.microsoft.com.
Cuando envía una solicitud de extracción, un CLA-bot determinará automáticamente si necesita proporcionar un CLA y decorar el PR de manera adecuada (por ejemplo, etiqueta, comentario). Simplemente siga las instrucciones proporcionadas por el bot. Solo necesitarás hacer esto una vez en todos los repositorios que utilicen nuestro CLA.
Este proyecto ha adoptado el Código de conducta de código abierto de Microsoft. Para obtener más información, consulte las preguntas frecuentes sobre el Código de conducta o comuníquese con [email protected] si tiene alguna pregunta o comentario adicional.
Colaboradores