ในโลกที่ขับเคลื่อนด้วยข้อมูลในปัจจุบัน นักวิจัยและนักวิทยาศาสตร์ข้อมูลจำนวนมากขึ้นเรื่อยๆ ใช้การเรียนรู้ของเครื่องเพื่อสร้างแบบจำลองที่ดีขึ้นหรือโซลูชันที่เป็นนวัตกรรมมากขึ้นเพื่ออนาคตที่ดีกว่า
โมเดลเหล่านี้มักจะจัดการกับข้อมูลที่ละเอียดอ่อนหรือข้อมูลส่วนบุคคล ซึ่งอาจทำให้เกิดปัญหาความเป็นส่วนตัวได้ ตัวอย่างเช่น โมเดล AI บางรุ่นสามารถจดจำรายละเอียดเกี่ยวกับข้อมูลที่ได้รับการฝึกอบรม และอาจรั่วไหลรายละเอียดเหล่านี้ในภายหลัง
เพื่อช่วยวัดการรั่วไหลของข้อมูลที่ละเอียดอ่อนและลดโอกาสที่จะเกิดขึ้น มีกรอบงานทางคณิตศาสตร์ที่เรียกว่าความเป็นส่วนตัวที่แตกต่างกัน
ในปี 2020 OpenMined ได้สร้าง Python Wrapper สำหรับโครงการ Differential Privacy ของ Google ที่เรียกว่า PyDP ไลบรารีจัดเตรียมชุดอัลกอริธึมส่วนตัว ε-ดิฟเฟอเรนเชียล ซึ่งสามารถใช้เพื่อสร้างสถิติรวมเหนือชุดข้อมูลตัวเลขที่มีข้อมูลส่วนตัวหรือข้อมูลที่ละเอียดอ่อน ดังนั้นด้วย PyDP คุณสามารถควบคุมการรับประกันความเป็นส่วนตัวและความแม่นยำของโมเดลของคุณที่เขียนด้วย Python
สิ่งที่ต้องจำเกี่ยวกับ PyDP:
หากต้องการติดตั้ง PyDP ให้ใช้ตัวจัดการแพ็คเกจ PyPI:
pip install python-dp
(หากคุณมี pip3
แยกต่างหากสำหรับ Python 3.x ให้ใช้ pip3 install python-dp
)
โปรดดูรายการบทช่วยสอนที่รวบรวมไว้และโค้ดตัวอย่างเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับไลบรารี PyDP
คุณสามารถเริ่มต้นด้วยการแนะนำ PyDP (สมุดบันทึก Jupyter) และการสาธิตแครอท (ไฟล์ Python)
ตัวอย่าง: คำนวณค่าเฉลี่ยขอบเขต
# Import PyDP
import pydp as dp
# Import the Bounded Mean algorithm
from pydp . algorithms . laplacian import BoundedMean
# Calculate the Bounded Mean
# Basic Structure: `BoundedMean(epsilon: float, lower_bound: Union[int, float, None], upper_bound: Union[int, float, None])`
# `epsilon`: a Double, between 0 and 1, denoting the privacy threshold,
# measures the acceptable loss of privacy (with 0 meaning no loss is acceptable)
x = BoundedMean ( epsilon = 0.6 , lower_bound = 1 , upper_bound = 10 )
# If the lower and upper bounds are not specified,
# PyDP automatically calculates these bounds
# x = BoundedMean(epsilon: float)
x = BoundedMean ( 0.6 )
# Calculate the result
# Currently supported data types are integers and floats
# Future versions will support additional data types
# (Refer to https://github.com/OpenMined/PyDP/blob/dev/examples/carrots.py)
x . quick_result ( input_data : list )
ไปที่แหล่งข้อมูลเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความเป็นส่วนตัวที่แตกต่าง
โปรดดูรูปแบบการโจมตีของ Google Differential Privacy Library ที่ซ่อนอยู่เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับสมมติฐานและข้อกำหนดของเราในการใช้ PyDP อย่างปลอดภัย
หากคุณมีคำถามเกี่ยวกับไลบรารี PyDP เข้าร่วม Slack ของ OpenMined และตรวจสอบช่อง #lib_pydp หากต้องการติดตามการเปลี่ยนแปลงแหล่งที่มาของโค้ด ให้เข้าร่วม #code_dp_python
เพื่อสนับสนุนโครงการ PyDP โปรดอ่านหลักเกณฑ์
ยินดีต้อนรับคำขอดึง หากคุณต้องการแนะนำการเปลี่ยนแปลงที่สำคัญ โปรดเปิดประเด็นก่อนเพื่อหารือเกี่ยวกับสิ่งที่คุณต้องการเปลี่ยนแปลง
โปรดตรวจสอบให้แน่ใจว่าได้อัปเดตการทดสอบตามความเหมาะสม
ใบอนุญาต Apache 2.0