lm steganography
1.0.0
这是出版物《走向近乎难以察觉的隐写文本》附带的代码库。它实现了论文中概述的语言隐写系统的设计、提出的patient-Huffman
算法以及我们在论文中用于实证研究的代码。
我们研究的隐写系统假设一个密码系统可以生成要编码为隐写文本的密文。在这项工作中,我们通过控制语言模型的采样将密文编码为流畅的隐写文本。我们专注于提供不可察觉性(隐写保密性),而密码安全性则由密码系统提供。
example.ipynb
包含一个完整的示例,包括加密/解密步骤。core.py
包含隐写系统编码/解码的说明性最小工作示例。GPT-2
(作为 git 子模块包含)和公开发布的GPT-2-117M
语言模型来生成隐写文本。patient-Huffman
编码算法。及其对应的解码方法。samples/
目录包含使用patient-Huffman
(不可感知参数为 0.08,随机位串长度为 32)生成的 20 个样本和来自基本语言模型的 20 个样本。这是为了通过将受控样本与不受控(标准采样)样本进行比较来提供算法所提供的不可察觉性的主观感觉。非常欢迎独立复制!请引起我们的注意,我们将在此处列出它们。对于我们在提交 ACL 时使用的原始代码,请参阅标记为acl-2019
git commit。
这是一个研究原型。请谨慎使用它作为隐私保护工具。
如果您发现此存储库或相关论文有用,请引用我们的工作。
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}