นี่คือโค้ดเบสที่มาพร้อมกับสิ่งพิมพ์ Towards Near-imperceptible Steganographic Text ใช้การออกแบบระบบสเตกาโนกราฟิกทางภาษาที่ระบุไว้ในรายงาน อัลกอริธึม patient-Huffman
ที่เสนอ ตลอดจนรหัสที่เราใช้ในการศึกษาเชิงประจักษ์ในรายงาน
ระบบสเตโกกราฟิกที่เราศึกษาถือว่าเป็นระบบเข้ารหัสที่สร้างไซเฟอร์เท็กซ์เพื่อเข้ารหัสเป็นสเตโกเท็กซ์ ในงานนี้ เราเข้ารหัสไซเฟอร์เท็กซ์ให้เป็นสเตโกเท็กซ์ได้อย่างคล่องแคล่วโดยการควบคุมการสุ่มตัวอย่างจากโมเดลภาษา เรามุ่งเน้นไปที่การให้ความไม่รับรู้ (การรักษาความลับแบบ Steganographic) ในขณะที่ระบบการเข้ารหัสนั้นให้การรักษาความปลอดภัยของการเข้ารหัส
example.ipynb
มีตัวอย่างแบบเต็มรวมถึงขั้นตอนการเข้ารหัส/ถอดรหัสcore.py
มีตัวอย่างการทำงานขั้นต่ำที่แสดงให้เห็นของการเข้ารหัส/ถอดรหัสของระบบสเตโกGPT-2
(รวมอยู่ในโมดูลย่อย git) และโมเดลภาษา GPT-2-117M
ที่เผยแพร่ต่อสาธารณะเพื่อสร้าง stegotextpatient-Huffman
และวิธีการถอดรหัสที่สอดคล้องกันsamples/
ไดเร็กทอรีประกอบด้วยตัวอย่าง 20 ตัวอย่างที่สร้างโดยใช้ patient-Huffman
(พารามิเตอร์ความไม่สามารถมองเห็นได้ 0.08 และบิตสตริงแบบสุ่มที่มีความยาว 32) และตัวอย่าง 20 ตัวอย่างจากโมเดลภาษาพื้นฐาน ทั้งนี้เพื่อให้ความรู้สึกส่วนตัวของความไม่รับรู้ที่นำเสนอโดยอัลกอริธึมโดยการเปรียบเทียบตัวอย่างที่ได้รับการควบคุมกับตัวอย่างที่ไม่มีการควบคุม (การสุ่มตัวอย่างแบบมาตรฐาน) การจำลองแบบอิสระนั้นน่ายินดีเป็นอย่างยิ่ง! โปรดแจ้งให้เราทราบ แล้วเราจะแสดงรายการไว้ที่นี่ สำหรับโค้ดต้นฉบับที่เราใช้ตอนส่ง ACL โปรดดูคอมมิตที่ติดแท็ก acl-2019
นี้มีวัตถุประสงค์เพื่อเป็นต้นแบบการวิจัย โปรดใช้ความระมัดระวังเมื่อใช้เป็นเครื่องมือปกป้องความเป็นส่วนตัว
โปรดอ้างอิงงานของเราหากคุณพบว่า repo นี้หรือเอกสารที่เกี่ยวข้องมีประโยชน์
Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.
@inproceedings { dai-cai-2019-towards ,
title = " Towards Near-imperceptible Steganographic Text " ,
author = " Dai, Falcon Z and Cai, Zheng " ,
booktitle = " Proceedings of Association for Computational Linguistics " ,
month = july,
year = " 2019 " ,
publisher = " Association for Computational Linguistics "
}