Presidio - 데이터 보호 및 비식별화 SDK
텍스트 및 이미지에 대한 상황 인식, 플러그형 및 사용자 정의 가능한 PII 비식별화 서비스입니다.
- 프레시디오 분석기
- 프레시디오 익명처리기
- Presidio 이미지 편집자
- 프레시디오 구조
프레시디오란?
Presidio (라틴어 praesidium '보호, 수비대'에서 유래) 는 중요한 데이터를 적절하게 관리하고 관리하는 데 도움이 됩니다. 신용카드 번호, 이름, 위치, 주민등록번호, 비트코인 지갑, 미국 전화번호, 금융 데이터 등과 같은 텍스트를 통해 민간 단체에 대한 빠른 식별 및 익명화 모듈을 제공합니다.
전체 문서
❓ 자주 묻는 질문
? 데모
? 예
프레시디오를 사용하고 계시나요? 우리는 방법을 알고 싶습니다.
이 짧은 익명 설문조사에 참여하여 개선에 도움을 주세요.
목표
- 비식별화 기술을 민주화하고 의사결정의 투명성을 도입함으로써 조직이 보다 간단한 방법으로 개인정보를 보호할 수 있습니다.
- 특정 비즈니스 요구에 맞게 확장성과 사용자 정의 가능성을 수용합니다.
- 여러 플랫폼에서 완전 자동화 및 반자동 PII 익명화 흐름을 모두 촉진합니다.
주요 기능
- 명명된 엔터티 인식 , 정규식 , 규칙 기반 논리 및 여러 언어의 관련 컨텍스트가 포함된 체크섬을 활용하는 사전 정의 또는 사용자 정의 PII 인식기입니다 .
- 외부 PII 감지 모델에 연결하기 위한 옵션입니다.
- Python 또는 PySpark 워크로드부터 Docker를 거쳐 Kubernetes까지 다양한 사용 옵션을 제공합니다.
- PII 식별 및 비식별화의 사용자 정의 가능 .
- 이미지의 PII 텍스트를 수정하기 위한 모듈(표준 이미지 유형 및 DICOM 의료 이미지)
️ Presidio는 구조화되지 않은 텍스트에서 민감한/PII 데이터를 식별하는 데 도움을 줄 수 있습니다. 그러나 자동화된 탐지 메커니즘을 사용하기 때문에 Presidio가 모든 민감한 정보를 찾을 것이라는 보장은 없습니다. 따라서 추가적인 시스템과 보호 장치를 채택해야 합니다.
프레시디오 설치
- 핍 사용
- 도커 사용
- 소스에서
- V1에서 V2로 마이그레이션
프레시디오를 달리다
- 시작하기
- 개발 환경 설정
- 텍스트의 PII 비식별화
- 이미지의 PII 익명화
- 사용 샘플 및 배포 예시
지원하다
- 문제를 제출하기 전에 문서를 검토하세요.
- 일반적인 토론은 Github repo의 토론 게시판을 이용하세요.
- 사용에 관한 질문이 있거나 버그를 발견했거나 개선을 위한 제안이 있는 경우 Github 문제를 제출해 주세요.
- 기타 사항은 [email protected]으로 이메일을 보내주세요.
기여
이 저장소에 기여하는 방법에 대한 자세한 내용은 기여 가이드를 참조하세요.
이 프로젝트는 기여와 제안을 환영합니다. 대부분의 기여는 귀하가 귀하의 기여를 사용할 권리가 있고 실제로 그렇게 할 권리가 있음을 선언하는 기여자 라이센스 계약(CLA)에 동의해야 합니다. 자세한 내용을 보려면 https://cla.microsoft.com을 방문하세요.
끌어오기 요청을 제출하면 CLA-bot이 자동으로 CLA를 제공해야 하는지 여부를 결정하고 PR을 적절하게 장식합니다(예: 라벨, 댓글). 봇이 제공하는 지침을 따르기만 하면 됩니다. CLA를 사용하여 모든 저장소에서 이 작업을 한 번만 수행하면 됩니다.
이 프로젝트는 Microsoft 오픈 소스 행동 강령을 채택했습니다. 자세한 내용은 행동 강령 FAQ를 참조하거나 추가 질문이나 의견이 있는 경우 [email protected]으로 문의하세요.
기여자