PII Masker é uma ferramenta avançada de código aberto que protege seus dados confidenciais usando IA de última geração, desenvolvida por DeBERTa-v3
Recursos • Instalação • Início rápido • Como funciona • Contribuindo
PII Masker é uma ferramenta avançada de código aberto projetada para proteger seus dados confidenciais, aproveitando modelos de IA de ponta. Construída com base no DeBERTa-v3, esta ferramenta garante detecção e mascaramento de alta precisão de informações de identificação pessoal (PII), tornando-a perfeita para qualquer fluxo de trabalho sensível a dados. Esteja você lidando com dados de clientes, realizando análises de dados ou garantindo a conformidade com regulamentos de privacidade, o PII Masker oferece uma solução robusta e escalável para manter suas informações seguras.
Ao lidar com informações confidenciais, é crucial usar ferramentas que não apenas tenham um bom desempenho, mas também garantam a conformidade e protejam a privacidade. Veja por que o PII Masker se destaca:
git clone https://github.com/yourusername/pii-masker.git
cd pii-masker
pip install -r requirements.txt
# Option 1: Manual download
# Visit: https://huggingface.co/collections/hydroxai/pii-models-674649fea0de7ab99ed11347
# Place files in: pii-masker/output_model/deberta3base_1024/
pii-masker
: cd pii-masker
from model import PIIMasker
# Initialize the PIIMasker
masker = PIIMasker ()
# Mask PII in your text
text = "John Doe lives at 1234 Elm St."
masked_text , pii_dict = masker . mask_pii ( text )
print ( masked_text )
# Output: "[NAME] lives at [ADDRESS]"
PII Masker emprega um pipeline sofisticado desenvolvido com DeBERTa-v3:
Temos o prazer de anunciar uma adição significativa ao projeto PII Masker: um novo modelo com uma abordagem diferente do DeBERTa. Aqui estão os detalhes:
? Link do modelo:
hidroxai/pii_model_longtransfomer_version
Detalhe do modelo:
train_pii_longtransformer.ipynb
? Melhoria de desempenho:
A implementação deste novo modelo resultou em uma melhoria de aproximadamente 4% no desempenho em comparação com o modelo DeBERTa-v3 anterior. A combinação do comprimento de sequência estendido do Longformer (4.096 tokens) e do cabeçote Bi-LSTM aprimora a compreensão do contexto sequencial, tornando a detecção de PII mais precisa e confiável.
Confira nossos exemplos detalhados:
As contribuições tornam a comunidade de código aberto um lugar incrível para aprender, inspirar e criar. Qualquer contribuição que você fizer será muito apreciada .
git commit -m 'Add some AmazingFeature'
)git push origin feature/AmazingFeature
)Agradecimentos especiais a:
Feito com ❤️ para a comunidade de desenvolvedores preocupados com a privacidade