Esta é a base de código que acompanha a publicação Towards Near-imperceptible Steganographic Text . Ele implementa o projeto do sistema esteganográfico linguístico descrito no artigo, o algoritmo patient-Huffman
proposto, bem como o código que usamos para o estudo empírico no artigo.
Os sistemas esteganográficos que estudamos assumem um sistema criptográfico que produz texto cifrado para ser codificado em estegotexto. Neste trabalho, codificamos o texto cifrado em estegotexto fluente, controlando a amostragem a partir de um modelo de linguagem. Nosso foco é fornecer imperceptibilidade (sigilo esteganográfico), enquanto a segurança criptográfica é fornecida pelo criptossistema.
example.ipynb
contém um exemplo completo incluindo as etapas de criptografia/descriptografia.core.py
contém um exemplo funcional mínimo ilustrativo da codificação/decodificação do estegosistema.GPT-2
(incluído como um submódulo git) e do modelo de linguagem GPT-2-117M
lançado publicamente para gerar estegotexto.patient-Huffman
. E seu método de decodificação correspondente.samples/
contém 20 amostras geradas usando patient-Huffman
(parâmetro de imperceptibilidade de 0,08 e bitstrings aleatórios de comprimento 32) e 20 amostras do modelo de linguagem base. Isto é para fornecer uma sensação subjetiva da imperceptibilidade oferecida pelo algoritmo, comparando as amostras controladas com as amostras não controladas (amostragem padrão). Replicações independentes são mais que bem-vindas! Por favor, traga-os à nossa atenção e nós os listaremos aqui. Para o código original que usamos no momento do envio da ACL, consulte o commit do git marcado como acl-2019
.
Este é um protótipo de pesquisa. Tenha cuidado ao usá-lo como uma ferramenta de proteção de privacidade.
Por favor, cite nosso trabalho se você achar este repositório ou o artigo associado útil.
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}