prompt guard
1.0.0
Prompt Guard เป็นรูปแบบตัวจําแนกโดย Meta ซึ่งได้รับการฝึกฝนบนคลังข้อมูลขนาดใหญ่ของการโจมตีสามารถตรวจจับการแจ้งเตือนที่เป็นอันตราย ( การแหกคุก ) อย่างชัดเจนรวมถึงข้อมูลที่มีอินพุตที่ฉีด ( ฉีดแจ้ง ) จากการวิเคราะห์จะส่งคืนคำตัดสินต่อไปนี้อย่างน้อยหนึ่งรายการพร้อมกับคะแนนความมั่นใจสำหรับแต่ละคน:
ที่เก็บนี้มีแอพ streamlit สำหรับการทดสอบตัวป้องกันพรอมต์ โปรดทราบว่าคุณจะต้องใช้โทเค็นการเข้าถึง HuggingFace เพื่อเข้าถึงรุ่น สำหรับการเขียนโดยละเอียดเพิ่มเติมโปรดดูโพสต์บล็อกนี้
นี่คือการตอบสนองตัวอย่างโดยตัวป้องกันที่รวดเร็วเมื่อตรวจจับความพยายามในการฉีดทันที
นี่คือการตอบสนองตัวอย่างโดยยามแจ้งเมื่อตรวจจับความพยายามในการแหกคุก