Ini adalah basis kode yang menyertai publikasi Menuju Teks Steganografi yang Hampir Tak Terlihat . Ini mengimplementasikan desain sistem steganografi linguistik yang diuraikan dalam makalah, algoritma patient-Huffman
yang diusulkan, serta kode yang kami gunakan untuk studi empiris dalam makalah.
Sistem steganografi yang kami pelajari mengasumsikan sistem kriptografi yang menghasilkan ciphertext untuk dikodekan menjadi stegotext. Dalam karya ini, kami mengkodekan ciphertext menjadi stegotext yang lancar dengan mengontrol pengambilan sampel dari model bahasa. Kami fokus pada penyediaan imperceptibility (kerahasiaan steganografi) sedangkan keamanan kriptografi disediakan oleh sistem kriptografi.
example.ipynb
berisi contoh lengkap termasuk langkah enkripsi/dekripsi.core.py
berisi contoh kerja minimal ilustratif dari pengkodean/penguraian kode stegosistem.GPT-2
(disertakan sebagai submodul git) dan model bahasa GPT-2-117M
yang dirilis secara publik untuk menghasilkan stegoteks.patient-Huffman
. Dan metode decoding yang sesuai.samples/
direktori berisi 20 sampel yang dihasilkan menggunakan patient-Huffman
(parameter imperceptibility 0,08, dan bitstring acak dengan panjang 32) dan 20 sampel dari model bahasa dasar. Hal ini untuk memberikan gambaran subjektif tentang ketidakjelasan yang ditawarkan oleh algoritme dengan membandingkan sampel yang dikontrol dengan sampel yang tidak terkontrol (pengambilan sampel standar). Replikasi independen sangat diharapkan! Harap sampaikan kepada kami dan kami akan mencantumkannya di sini. Untuk kode asli yang kami gunakan pada saat pengiriman ACL, lihat git commit yang diberi tag acl-2019
.
Hal ini dimaksudkan sebagai prototipe penelitian. Harap berhati-hati saat menggunakannya sebagai alat perlindungan privasi.
Silakan kutip karya kami jika Anda merasa repo ini atau makalah terkait bermanfaat.
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}