lm steganography下载 - lm steganography源代码下载

lm steganography

Ai源码

1.0.0

下载

隐写术

这是出版物《走向近乎难以察觉的隐写文本》附带的代码库。它实现了论文中概述的语言隐写系统的设计、提出的patient-Huffman算法以及我们在论文中用于实证研究的代码。

初步的

我们研究的隐写系统假设一个密码系统可以生成要编码为隐写文本的密文。在这项工作中，我们通过控制语言模型的采样将密文编码为流畅的隐写文本。我们专注于提供不可察觉性（隐写保密性），而密码安全性则由密码系统提供。

用法

example.ipynb包含一个完整的示例，包括加密/解密步骤。
core.py包含隐写系统编码/解码的说明性最小工作示例。
您可能需要GPT-2 （作为 git 子模块包含）和公开发布的GPT-2-117M语言模型来生成隐写文本。
该方法实现了patient-Huffman编码算法。及其对应的解码方法。
samples/目录包含使用patient-Huffman （不可感知参数为 0.08，随机位串长度为 32）生成的 20 个样本和来自基本语言模型的 20 个样本。这是为了通过将受控样本与不受控（标准采样）样本进行比较来提供算法所提供的不可察觉性的主观感觉。
该笔记本包含图表和实证分析。

复制

非常欢迎独立复制！请引起我们的注意，我们将在此处列出它们。对于我们在提交 ACL 时使用的原始代码，请参阅标记为acl-2019 git commit。

常问问题

这是一个研究原型。请谨慎使用它作为隐私保护工具。

什么是隐写术？
- 隐写术是关于隐藏一个人正在隐藏某些东西的事实。其目的是避免引起窃听者（或通道监控者）怀疑正在发生某些秘密通信。
我们所说的不可察觉是什么意思？
- 理想情况下，我们希望隐写通信是难以察觉的，即隐藏在众目睽睽之下。特别是，我们通过询问对手需要多少样本才能发现隐写通信的存在来形式化这个概念。这正是有效语言模型和基础语言模型之间的总变异距离（以及 Kullback-Leibler 散度）所测量的。
是否存在任何已知的漏洞？
- 在本文的设置中，我们假设对手是被动的，即它只是观察消息。人们可以想象一个更强大的对手也可以干扰消息本身。这种对手的目的可能是破坏隐写通信，但不一定发现其存在或破坏非秘密通信。例如，通过注入常见的拼写错误。这种设置有时被称为鲁棒隐写术，我们认为这种类型的隐写系统在这种攻击下是脆弱的。

参考

如果您发现此存储库或相关论文有用，请引用我们的工作。

 Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.

 @inproceedings { dai-cai-2019-towards ,
    title = " Towards Near-imperceptible Steganographic Text " ,
    author = " Dai, Falcon Z and Cai, Zheng " ,
    booktitle = " Proceedings of Association for Computational Linguistics " ,
    month = july,
    year = " 2019 " ,
    publisher = " Association for Computational Linguistics "
  }