PyDPダウンロード - PyDPソースコードのダウンロード

PyDP

C/C++

1.1.4

ダウンロード

PyDP

今日のデータ主導の世界では、機械学習を使用してより良いモデルやより革新的なソリューションを作成し、より良い未来を実現する研究者やデータサイエンティストがますます増えています。

これらのモデルは多くの場合、機密データや個人データを扱う傾向があり、プライバシーの問題を引き起こす可能性があります。たとえば、一部の AI モデルは、トレーニングされたデータの詳細を記憶することができ、これらの詳細が後で漏洩する可能性があります。

機密データの漏洩を測定し、その可能性を減らすために、差分プライバシーと呼ばれる数学的フレームワークがあります。

2020 年、OpenMined は、PyDP と呼ばれる Google の差分プライバシープロジェクト用の Python ラッパーを作成しました。このライブラリは、プライベート情報や機密情報を含む数値データセットの集計統計を生成するために使用できる、ε 差分プライベートアルゴリズムのセットを提供します。したがって、PyDP を使用すると、Python で作成されたモデルのプライバシーの保証と精度を制御できます。

PyDP について覚えておくべきこと:

BoundedMean、BoundedSum、Max、Count Above、Percentile、Min、Median などの差分プライベートアルゴリズムを備えています。
- 上記の計算方法はすべてラプラスノイズのみを使用します (他のノイズメカニズムもすぐに追加される予定です! ?)
Linux、macOS、Windows の 3 種類のオペレーティングシステムすべてと互換性がありますか?
Python 3.x を使用します。

インストール

PyDP をインストールするには、PyPI パッケージマネージャーを使用します。

pip install python-dp

(Python 3.x 用に個別にpip3がある場合は、 pip3 install python-dpを使用します。)

例

PyDP ライブラリの詳細については、チュートリアルとサンプルコードの厳選されたリストを参照してください。

PyDP (Jupyter ノートブック) とキャロットデモ (Python ファイル) の概要から始めることもできます。

例: 有界平均を計算する

 # Import PyDP
import pydp as dp
# Import the Bounded Mean algorithm
from pydp . algorithms . laplacian import BoundedMean

# Calculate the Bounded Mean
# Basic Structure: `BoundedMean(epsilon: float, lower_bound: Union[int, float, None], upper_bound: Union[int, float, None])`
# `epsilon`: a Double, between 0 and 1, denoting the privacy threshold,
#            measures the acceptable loss of privacy (with 0 meaning no loss is acceptable)
x = BoundedMean ( epsilon = 0.6 , lower_bound = 1 , upper_bound = 10 )

# If the lower and upper bounds are not specified,
# PyDP automatically calculates these bounds
# x = BoundedMean(epsilon: float)
x = BoundedMean ( 0.6 )

# Calculate the result
# Currently supported data types are integers and floats
# Future versions will support additional data types
# (Refer to https://github.com/OpenMined/PyDP/blob/dev/examples/carrots.py)
x . quick_result ( input_data : list )