Presidio - データ保護および匿名化 SDK
テキストと画像のコンテキスト認識型、プラグイン可能、カスタマイズ可能な PII 匿名化サービス。
- プレシディオアナライザー
- プレシディオ アノニマイザー
- プレシディオ画像編集者
- プレシディオ構造化
プレシディオとは
Presidio (ラテン語の praesidium 「保護、駐屯地」に由来)は、機密データが適切に管理および統制されていることを確認するのに役立ちます。クレジット カード番号、名前、場所、社会保障番号、ビットコイン ウォレット、米国の電話番号、財務データなどのテキスト内の個人エンティティの高速識別および匿名化モジュールを提供します。
完全なドキュメント
❓ よくある質問
?デモ
?例
プレシディオ使ってますか?ぜひその方法を知りたいです
この匿名の短いアンケートにご協力いただき、改善にご協力ください。
目標
- 匿名化テクノロジーを民主化し、意思決定に透明性を導入することで、組織がより簡単な方法でプライバシーを保護できるようにします。
- 特定のビジネス ニーズに合わせた拡張性とカスタマイズ性を採用します。
- 複数のプラットフォーム上で完全自動および半自動の両方の PII 匿名化フローを促進します。
主な特長
- 固有表現認識、正規表現、ルールベースのロジック、および複数言語の関連コンテキストを含むチェックサムを活用した、事前定義またはカスタムの PII 認識機能。
- 外部 PII 検出モデルに接続するためのオプション。
- Python または PySpark ワークロードから Docker 、Kubernetes まで、複数の使用オプション。
- PII の識別と匿名化のカスタマイズ可能性。
- 画像内の PII テキストを編集するためのモジュール (標準画像タイプおよび DICOM 医療画像)。
️ Presidio は、非/構造化テキスト内の機密/PII データを識別するのに役立ちます。ただし、自動検出メカニズムを使用しているため、Presidio がすべての機密情報を見つけるという保証はありません。したがって、追加のシステムと保護を採用する必要があります。
Presidio のインストール
- ピップの使用
- Docker の使用
- ソースから
- V1 から V2 への移行
ランニング プレシディオ
- はじめる
- 開発環境のセットアップ
- テキスト内の PII 匿名化
- 画像内の PII 匿名化
- 使用例と導入例
サポート
- 問題を送信する前に、ドキュメントに目を通してください。
- 一般的な議論については、Github リポジトリのディスカッション掲示板をご利用ください。
- 使用方法に関する質問がある場合、バグを見つけた場合、または改善の提案がある場合は、Github の問題を提出してください。
- その他の問題については、[email protected] まで電子メールでお問い合わせください。
貢献する
このリポジトリへの貢献の詳細については、貢献ガイドを参照してください。
このプロジェクトは貢献と提案を歓迎します。ほとんどの投稿では、投稿を使用する権利をお客様が有しており、実際に当社に付与することを宣言する投稿者ライセンス契約 (CLA) に同意する必要があります。詳細については、https://cla.microsoft.com をご覧ください。
プル リクエストを送信すると、CLA ボットが CLA を提供する必要があるかどうかを自動的に判断し、PR を適切に装飾します (ラベル、コメントなど)。ボットが提供する指示に従ってください。 CLA を使用するすべてのリポジトリでこれを 1 回行うだけで済みます。
このプロジェクトはマイクロソフトのオープンソース行動規範を採用しています。詳細については、「行動規範に関するよくある質問」を参照するか、追加の質問やコメントがあれば [email protected] までお問い合わせください。
貢献者