lm steganography
1.0.0
이것은 거의 감지할 수 없는 스테가노그래픽 텍스트를 향하여 출판물과 함께 제공되는 코드베이스입니다. 논문에서 제안한 patient-Huffman
알고리즘과 논문에서 실증적 연구에 사용한 코드에 설명된 언어 스테가노그래픽 시스템의 설계를 구현합니다.
우리가 연구한 스테가노그래픽 시스템은 스테고텍스트로 인코딩될 암호문을 생성하는 암호화 시스템을 가정합니다. 이 작업에서는 언어 모델의 샘플링을 제어하여 암호문을 유창한 스테고텍스트로 인코딩합니다. 우리는 암호화 보안이 암호화 시스템에 의해 제공되는 반면, 우리는 인지 불가능성(스테가노그래픽 비밀성)을 제공하는 데 중점을 둡니다.
example.ipynb
에는 암호화/암호 해독 단계를 포함한 전체 예제가 포함되어 있습니다.core.py
에는 stegosystem의 인코딩/디코딩에 대한 예시적인 최소 작업 예제가 포함되어 있습니다.GPT-2
(git 하위 모듈로 포함됨)와 공개적으로 출시된 GPT-2-117M
언어 모델이 필요할 수 있습니다.patient-Huffman
인코딩 알고리즘을 구현합니다. 그리고 그에 상응하는 디코딩 방법.samples/
디렉토리에는 patient-Huffman
(비지각 매개변수 0.08, 무작위 비트열 길이 32)을 사용하여 생성된 20개의 샘플과 기본 언어 모델의 20개 샘플이 포함되어 있습니다. 이는 제어된 샘플을 제어되지 않은(표준 샘플링) 샘플과 비교하여 알고리즘이 제공하는 민감성에 대한 주관적인 감각을 제공하기 위한 것입니다. 독립적인 복제를 환영합니다! 우리에게 알려주시면 여기에 나열하겠습니다. ACL 제출 시 사용한 원본 코드는 acl-2019
태그가 지정된 git 커밋을 참조하세요.
이는 연구 프로토타입으로 제작되었습니다. 개인정보 보호 도구로 사용할 때는 주의하시기 바랍니다.
이 저장소나 관련 논문이 유용하다고 생각되면 우리 작업을 인용해 주세요.
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}