PII Masker es una herramienta avanzada de código abierto que protege sus datos confidenciales utilizando IA de última generación, impulsada por DeBERTa-v3.
Características • Instalación • Inicio rápido • Cómo funciona • Contribución
PII Masker es una herramienta avanzada de código abierto diseñada para proteger sus datos confidenciales aprovechando modelos de inteligencia artificial de vanguardia. Construida sobre DeBERTa-v3, esta herramienta garantiza la detección y el enmascaramiento de alta precisión de información de identificación personal (PII), lo que la hace perfecta para cualquier flujo de trabajo sensible a datos. Ya sea que esté manejando datos de clientes, realizando análisis de datos o garantizando el cumplimiento de las normas de privacidad, PII Masker proporciona una solución sólida y escalable para mantener su información segura.
Al manejar información confidencial, es fundamental utilizar herramientas que no solo funcionen bien sino que también garanticen el cumplimiento y protejan la privacidad. He aquí por qué se destaca PII Masker:
git clone https://github.com/yourusername/pii-masker.git
cd pii-masker
pip install -r requirements.txt
# Option 1: Manual download
# Visit: https://huggingface.co/collections/hydroxai/pii-models-674649fea0de7ab99ed11347
# Place files in: pii-masker/output_model/deberta3base_1024/
pii-masker
: cd pii-masker
from model import PIIMasker
# Initialize the PIIMasker
masker = PIIMasker ()
# Mask PII in your text
text = "John Doe lives at 1234 Elm St."
masked_text , pii_dict = masker . mask_pii ( text )
print ( masked_text )
# Output: "[NAME] lives at [ADDRESS]"
PII Masker emplea un sofisticado proceso impulsado por DeBERTa-v3:
Nos complace anunciar una incorporación importante al proyecto PII Masker: un nuevo modelo con un enfoque diferente al de DeBERTa. Aquí están los detalles:
? Enlace modelo:
hydroxai/pii_model_longtransfomer_version
Detalle del modelo:
train_pii_longtransformer.ipynb
? Mejora del rendimiento:
La implementación de este nuevo modelo ha resultado en aproximadamente una mejora del 4% en el rendimiento en comparación con el modelo anterior DeBERTa-v3. La combinación de la longitud de secuencia extendida de Longformer (4096 tokens) y el cabezal Bi-LSTM mejora la comprensión del contexto secuencial, lo que hace que la detección de PII sea más precisa y confiable.
Consulte nuestros ejemplos detallados:
Las contribuciones hacen de la comunidad de código abierto un lugar increíble para aprender, inspirar y crear. Cualquier contribución que hagas será muy apreciada .
git commit -m 'Add some AmazingFeature'
)git push origin feature/AmazingFeature
)Un agradecimiento especial a:
Hecho con ❤️ para la comunidad de desarrolladores preocupados por la privacidad