lm steganography ดาวน์โหลด - lm steganography ดาวน์โหลดซอร์สโค้ด

lm steganography

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

lm-steganography

นี่คือโค้ดเบสที่มาพร้อมกับสิ่งพิมพ์ Towards Near-imperceptible Steganographic Text ใช้การออกแบบระบบสเตกาโนกราฟิกทางภาษาที่ระบุไว้ในรายงาน อัลกอริธึม patient-Huffman ที่เสนอ ตลอดจนรหัสที่เราใช้ในการศึกษาเชิงประจักษ์ในรายงาน

เบื้องต้น

ระบบสเตโกกราฟิกที่เราศึกษาถือว่าเป็นระบบเข้ารหัสที่สร้างไซเฟอร์เท็กซ์เพื่อเข้ารหัสเป็นสเตโกเท็กซ์ ในงานนี้ เราเข้ารหัสไซเฟอร์เท็กซ์ให้เป็นสเตโกเท็กซ์ได้อย่างคล่องแคล่วโดยการควบคุมการสุ่มตัวอย่างจากโมเดลภาษา เรามุ่งเน้นไปที่การให้ความไม่รับรู้ (การรักษาความลับแบบ Steganographic) ในขณะที่ระบบการเข้ารหัสนั้นให้การรักษาความปลอดภัยของการเข้ารหัส

การใช้งาน

example.ipynb มีตัวอย่างแบบเต็มรวมถึงขั้นตอนการเข้ารหัส/ถอดรหัส
core.py มีตัวอย่างการทำงานขั้นต่ำที่แสดงให้เห็นของการเข้ารหัส/ถอดรหัสของระบบสเตโก
คุณอาจต้องใช้ GPT-2 (รวมอยู่ในโมดูลย่อย git) และโมเดลภาษา GPT-2-117M ที่เผยแพร่ต่อสาธารณะเพื่อสร้าง stegotext
วิธีการนี้ใช้อัลกอริธึมการเข้ารหัส patient-Huffman และวิธีการถอดรหัสที่สอดคล้องกัน
samples/ ไดเร็กทอรีประกอบด้วยตัวอย่าง 20 ตัวอย่างที่สร้างโดยใช้ patient-Huffman (พารามิเตอร์ความไม่สามารถมองเห็นได้ 0.08 และบิตสตริงแบบสุ่มที่มีความยาว 32) และตัวอย่าง 20 ตัวอย่างจากโมเดลภาษาพื้นฐาน ทั้งนี้เพื่อให้ความรู้สึกส่วนตัวของความไม่รับรู้ที่นำเสนอโดยอัลกอริธึมโดยการเปรียบเทียบตัวอย่างที่ได้รับการควบคุมกับตัวอย่างที่ไม่มีการควบคุม (การสุ่มตัวอย่างแบบมาตรฐาน)
สมุดบันทึกเล่มนี้ประกอบด้วยโครงเรื่องและการวิเคราะห์เชิงประจักษ์

การจำลองแบบ

การจำลองแบบอิสระนั้นน่ายินดีเป็นอย่างยิ่ง! โปรดแจ้งให้เราทราบ แล้วเราจะแสดงรายการไว้ที่นี่ สำหรับโค้ดต้นฉบับที่เราใช้ตอนส่ง ACL โปรดดูคอมมิตที่ติดแท็ก acl-2019

คำถามที่พบบ่อย

นี้มีวัตถุประสงค์เพื่อเป็นต้นแบบการวิจัย โปรดใช้ความระมัดระวังเมื่อใช้เป็นเครื่องมือปกป้องความเป็นส่วนตัว

ซูรินาเมคืออะไร?
- Steganography คือการซ่อนความจริงที่ว่าใครคนหนึ่งกำลังซ่อนบางสิ่งบางอย่างอยู่ มีจุดมุ่งหมายเพื่อหลีกเลี่ยงการปลุกเร้าความสงสัยของผู้ดักฟัง (หรือผู้ตรวจสอบช่องสัญญาณ) ว่าการสื่อสารลับบางอย่างกำลังเกิดขึ้น
เราหมายถึงอะไรโดยความไม่เข้าใจ?
- ตามหลักการแล้ว เราต้องการให้การสื่อสารแบบ Steganographic เป็นสิ่งที่มองไม่เห็น กล่าวคือ ซ่อนตัวอยู่ในสายตาธรรมดา โดยเฉพาะอย่างยิ่ง เราทำให้แนวคิดนี้เป็นทางการโดยการถามว่าต้องใช้ตัวอย่างกี่ตัวอย่างเพื่อให้ฝ่ายตรงข้ามค้นพบการมีอยู่ของการสื่อสารแบบสุลต่านกราฟิก นี่คือระยะทางของการแปรผันทั้งหมด (และความแตกต่างของ Kullback–Leibler) ระหว่างแบบจำลองภาษาที่มีประสิทธิภาพและแบบจำลองภาษาพื้นฐานที่วัด
มีช่องโหว่ที่ทราบหรือไม่?
- ในบริบทของรายงาน เราถือว่าฝ่ายตรงข้ามอยู่เฉย กล่าวคือเป็นเพียงการสังเกตข้อความเท่านั้น เราสามารถจินตนาการถึงศัตรูที่แข็งแกร่งกว่าซึ่งสามารถเข้าไปยุ่งกับข้อความได้ด้วยเช่นกัน จุดมุ่งหมายของปฏิปักษ์ดังกล่าวอาจเป็นการขัดขวางการสื่อสารแบบ Steganographic โดยไม่จำเป็นต้องค้นพบการมีอยู่ของการสื่อสารนั้นหรือขัดขวางการสื่อสารที่ไม่เป็นความลับ เช่น โดยการใส่คำผิดทั่วไป การตั้งค่านี้บางครั้งเรียกว่าการอำพราง อย่างแข็งแกร่ง และประเภทของระบบสเตโกที่เราถือว่า เปราะบางภาย ใต้การโจมตีดังกล่าว

อ้างอิง

โปรดอ้างอิงงานของเราหากคุณพบว่า repo นี้หรือเอกสารที่เกี่ยวข้องมีประโยชน์

 Dai, Falcon Z and Cai, Zheng. Towards Near-imperceptible Steganographic Text. Proceedings of ACL. 2019.

 @inproceedings { dai-cai-2019-towards ,
    title = " Towards Near-imperceptible Steganographic Text " ,
    author = " Dai, Falcon Z and Cai, Zheng " ,
    booktitle = " Proceedings of Association for Computational Linguistics " ,
    month = july,
    year = " 2019 " ,
    publisher = " Association for Computational Linguistics "
  }