pii masker
1.0.0
PII Masker 是一款先進的開源工具,可使用由 DeBERTa-v3 提供支援的最先進的 AI 來保護您的敏感數據
功能•安裝•快速入門•工作原理•貢獻
PII Masker 是一種先進的開源工具,旨在利用尖端的人工智慧模型來保護您的敏感資料。此工具建構於 DeBERTa-v3 之上,可確保高精度偵測和屏蔽個人識別資訊 (PII),使其完美適合任何資料敏感的工作流程。無論您是處理客戶資料、執行資料分析還是確保遵守隱私法規,PII Masker 都能提供強大、可擴展的解決方案來確保您的資訊安全。
處理敏感資訊時,使用不僅效能良好而且能夠確保合規性和保護隱私的工具至關重要。這就是 PII Masker 脫穎而出的原因:
git clone https://github.com/yourusername/pii-masker.git
cd pii-masker
pip install -r requirements.txt
# Option 1: Manual download
# Visit: https://huggingface.co/collections/hydroxai/pii-models-674649fea0de7ab99ed11347
# Place files in: pii-masker/output_model/deberta3base_1024/
pii-masker
目錄: cd pii-masker
from model import PIIMasker
# Initialize the PIIMasker
masker = PIIMasker ()
# Mask PII in your text
text = "John Doe lives at 1234 Elm St."
masked_text , pii_dict = masker . mask_pii ( text )
print ( masked_text )
# Output: "[NAME] lives at [ADDRESS]"
PII Masker 採用 DeBERTa-v3 提供支援的複雜管道:
我們很高興地宣布 PII Masker 計畫的一項重要補充:採用與 DeBERTa 不同方法的新模型。詳細資訊如下:
?型號連結:
Hydroxai/pii_model_longtransfomer_version
型號詳情:
train_pii_longtransformer.ipynb
?性能改進:
與先前的 DeBERTa-v3 模型相比,這種新模型的實施使性能提高了約 4%。 Longformer 的擴展序列長度(4096 個標記)與 Bi-LSTM 頭的結合增強了順序上下文理解,使 PII 檢測更加準確和可靠。
查看我們的詳細範例:
貢獻使開源社群成為學習、啟發和創造的絕佳場所。我們非常感謝您所做的任何貢獻。
git commit -m 'Add some AmazingFeature'
)git push origin feature/AmazingFeature
)特別感謝:
使用 ❤️ 為注重隱私的開發者社群打造