lm steganography
1.0.0
これは、出版物「Towards Near-imperceptible Steganographic Text」に付属するコードベースです。これは、論文で概説されている言語ステガノグラフィー システムの設計、提案されているpatient-Huffman
アルゴリズム、および論文の実証研究に使用したコードを実装しています。
私たちが研究したステガノグラフィー システムは、ステゴテキストにエンコードされる暗号文を生成する暗号化システムを前提としています。この研究では、言語モデルからのサンプリングを制御することにより、暗号文を流暢なステゴテキストにエンコードします。私たちは、暗号化セキュリティが暗号システムによって提供されるのに対し、知覚不可能性 (ステガノグラフィー的秘密性) を提供することに重点を置いています。
example.ipynb
には、暗号化/復号化の手順を含む完全な例が含まれています。core.py
は、stegosystem のエンコード/デコードの最小限の動作例が含まれています。GPT-2
(git サブモジュールとして含まれています) と、公開されているGPT-2-117M
言語モデルが必要になる場合があります。patient-Huffman
符号化アルゴリズムを実装します。およびそれに対応するデコード方法。samples/
ディレクトリには、 patient-Huffman
(知覚不能パラメータ 0.08、長さ 32 のランダム ビット文字列) を使用して生成された 20 個のサンプルと、基本言語モデルからの 20 個のサンプルが含まれています。これは、制御されたサンプルを制御されていない (標準サンプリング) サンプルと比較することによって、アルゴリズムによってもたらされる知覚不可能性の主観的な感覚を提供するためです。独立したレプリケーションは大歓迎です。それらをここにリストしますので、私たちの注意を引いてください。 ACL の送信時に使用した元のコードについては、 acl-2019
タグが付いた git コミットを参照してください。
これは研究プロトタイプとして意図されています。プライバシー保護ツールとして使用する場合にはご注意ください。
このリポジトリまたは関連論文が役立つと思われる場合は、私たちの成果を引用してください。
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}