Presidio - SDK de proteção de dados e desidentificação
Serviço de desidentificação de PII consciente do contexto, conectável e personalizável para texto e imagens.
- Analisador Presidio
- Anonimizador Presidio
- Redator de imagens do Presidio
- Presídio Estruturado
O que é Presídio
Presidio (Origem do latim praesidium 'proteção, guarnição') ajuda a garantir que dados confidenciais sejam gerenciados e governados adequadamente. Ele fornece módulos rápidos de identificação e anonimato para entidades privadas em texto, como números de cartão de crédito, nomes, locais, números de previdência social, carteiras bitcoin, números de telefone dos EUA, dados financeiros e muito mais.
Documentação completa
❓ Perguntas frequentes
? Demonstração
? Exemplos
Você está usando o Presidio? Adoraríamos saber como
Por favor, ajude-nos a melhorar respondendo a esta breve pesquisa anônima.
Metas
- Permitir que as organizações preservem a privacidade de uma forma mais simples, democratizando as tecnologias de desidentificação e introduzindo transparência nas decisões.
- Adote a extensibilidade e a personalização para uma necessidade comercial específica.
- Facilite fluxos de desidentificação de PII totalmente automatizados e semiautomáticos em diversas plataformas.
Principais características
- Reconhecedores de PII predefinidos ou personalizados que aproveitam o reconhecimento de entidade nomeada , expressões regulares , lógica baseada em regras e soma de verificação com contexto relevante em vários idiomas.
- Opções para conexão com modelos externos de detecção de PII.
- Múltiplas opções de uso, desde cargas de trabalho Python ou PySpark, passando por Docker até Kubernetes .
- Personalização na identificação e desidentificação de PII.
- Módulo para redação de texto PII em imagens (tipos de imagem padrão e imagens médicas DICOM).
️ O Presidio pode ajudar a identificar dados confidenciais/PII em texto não estruturado. No entanto, por utilizar mecanismos de detecção automatizados, não há garantia de que o Presidio encontrará todas as informações confidenciais. Consequentemente, sistemas e proteções adicionais devem ser empregados.
Instalando o Presídio
- Usando pip
- Usando Docker
- Da fonte
- Migrando de V1 para V2
Executando o Presídio
- Começando
- Configurando um ambiente de desenvolvimento
- Desidentificação de PII no texto
- Desidentificação de PII em imagens
- Amostras de uso e exemplos de implantações
Apoiar
- Antes de enviar um problema, consulte a documentação.
- Para discussões gerais, use o quadro de discussão do repositório Github.
- Se você tiver uma dúvida sobre uso, encontrou um bug ou tem uma sugestão de melhoria, registre um problema no Github.
- Para outros assuntos, envie um email para [email protected].
Contribuindo
Para obter detalhes sobre como contribuir para este repositório, consulte o guia de contribuição.
Este projeto aceita contribuições e sugestões. A maioria das contribuições exige que você concorde com um Contrato de Licença de Colaborador (CLA), declarando que você tem o direito de nos conceder, e realmente nos concede, os direitos de uso de sua contribuição. Para obter detalhes, visite https://cla.microsoft.com.
Quando você envia uma solicitação pull, um bot CLA determinará automaticamente se você precisa fornecer um CLA e decorará o PR adequadamente (por exemplo, rótulo, comentário). Basta seguir as instruções fornecidas pelo bot. Você só precisará fazer isso uma vez em todos os repositórios usando nosso CLA.
Este projeto adotou o Código de Conduta de Código Aberto da Microsoft. Para obter mais informações, consulte as Perguntas frequentes sobre o Código de Conduta ou entre em contato com [email protected] com perguntas ou comentários adicionais.
Colaboradores