Di dunia yang berbasis data saat ini, semakin banyak peneliti dan ilmuwan data yang menggunakan pembelajaran mesin untuk menciptakan model yang lebih baik atau solusi yang lebih inovatif demi masa depan yang lebih baik.
Model ini sering kali cenderung menangani data sensitif atau pribadi, yang dapat menyebabkan masalah privasi. Misalnya, beberapa model AI dapat mengingat detail data yang telah dilatih dan berpotensi membocorkan detail tersebut di kemudian hari.
Untuk membantu mengukur kebocoran data sensitif dan mengurangi kemungkinan terjadinya, terdapat kerangka matematika yang disebut privasi diferensial.
Pada tahun 2020, OpenMined membuat pembungkus Python untuk proyek Privasi Diferensial Google yang disebut PyDP. Perpustakaan menyediakan serangkaian algoritma privat ε-diferensial, yang dapat digunakan untuk menghasilkan statistik agregat atas kumpulan data numerik yang berisi informasi pribadi atau sensitif. Oleh karena itu, dengan PyDP Anda dapat mengontrol jaminan privasi dan keakuratan model Anda yang ditulis dengan Python.
Hal yang perlu diingat tentang PyDP:
Untuk menginstal PyDP, gunakan manajer paket PyPI:
pip install python-dp
(Jika Anda memiliki pip3
secara terpisah untuk Python 3.x, gunakan pip3 install python-dp
.)
Lihat daftar tutorial dan kode contoh pilihan untuk mempelajari lebih lanjut tentang perpustakaan PyDP.
Anda juga dapat memulai dengan pengenalan PyDP (notebook Jupyter) dan demo wortel (file Python).
Contoh: menghitung Bounded Mean
# Import PyDP
import pydp as dp
# Import the Bounded Mean algorithm
from pydp . algorithms . laplacian import BoundedMean
# Calculate the Bounded Mean
# Basic Structure: `BoundedMean(epsilon: float, lower_bound: Union[int, float, None], upper_bound: Union[int, float, None])`
# `epsilon`: a Double, between 0 and 1, denoting the privacy threshold,
# measures the acceptable loss of privacy (with 0 meaning no loss is acceptable)
x = BoundedMean ( epsilon = 0.6 , lower_bound = 1 , upper_bound = 10 )
# If the lower and upper bounds are not specified,
# PyDP automatically calculates these bounds
# x = BoundedMean(epsilon: float)
x = BoundedMean ( 0.6 )
# Calculate the result
# Currently supported data types are integers and floats
# Future versions will support additional data types
# (Refer to https://github.com/OpenMined/PyDP/blob/dev/examples/carrots.py)
x . quick_result ( input_data : list )
Buka sumber daya untuk mempelajari lebih lanjut tentang privasi diferensial.
Silakan lihat model serangan dari Perpustakaan Privasi Diferensial Google yang mendasarinya untuk mempelajari lebih lanjut asumsi dan persyaratan kami untuk menggunakan PyDP dengan cara yang aman.
Jika Anda memiliki pertanyaan tentang perpustakaan PyDP, bergabunglah dengan Slack OpenMined dan periksa saluran #lib_pydp . Untuk mengikuti perubahan sumber kode, bergabunglah dengan #code_dp_python .
Untuk berkontribusi pada proyek PyDP, baca pedomannya.
Permintaan tarik dipersilakan. Jika Anda ingin melakukan perubahan besar, silakan buka terbitan terlebih dahulu untuk mendiskusikan apa yang ingin Anda ubah.
Harap pastikan untuk memperbarui pengujian sebagaimana mestinya.
Lisensi Apache 2.0