ดาวน์โหลด last_layer - ดาวน์โหลดซอร์สโค้ด last

last_layer

โค้ดแหล่งที่มา AI

0.1.33

ดาวน์โหลด

ชั้นสุดท้าย

โซลูชันการรักษาความปลอดภัย LLM แบบแฝงต่ำเป็นพิเศษ

last_layer เป็นห้องสมุดความปลอดภัยที่ออกแบบมาเพื่อปกป้องแอปพลิเคชัน LLM จากการโจมตีแบบฉีดทันทีการแหกคุกและการหาประโยชน์ มันทำหน้าที่เป็นเลเยอร์การกรองที่แข็งแกร่งเพื่อตรวจสอบพรอมต์ก่อนที่จะดำเนินการโดย LLMs เพื่อให้มั่นใจว่าได้รับอนุญาตให้ใช้เนื้อหาที่ปลอดภัยและเหมาะสมเท่านั้น

บันทึก

 Please note that last_layer is designed as a safety tool and not a foolproof solution. It significantly reduces the risk of prompt-based attacks and exploits but cannot guarantee complete protection against all possible threats.

คุณสมบัติ ?

การสแกนเร็วเป็นพิเศษ ⚡: บรรลุ> = 2ms แฝงสำหรับการสแกนการฉีด/การแหกคุกแบบทันทีบนซีพียูเพื่อให้มั่นใจว่ามีผลกระทบน้อยที่สุดต่อประสบการณ์ผู้ใช้
มุ่งเน้นความเป็นส่วนตัว : ได้รับการออกแบบโดยคำนึงถึงความเป็นส่วนตัว last_layer ทำงานโดยไม่ต้องติดตามหรือโทรหาเครือข่ายเพื่อให้มั่นใจว่าข้อมูลจะอยู่ภายในโครงสร้างพื้นฐานของคุณขนาดแพ็คเกจต่ำกว่า 50 MB
Serverless-ready ☁: เข้ากันได้กับแพลตฟอร์มที่ไม่มีเซิร์ฟเวอร์เช่น Vercel หรือ AWS Lambda
กลไกการตรวจจับขั้นสูง ‍♂: ใช้การรวมกันของแบบจำลอง AutomL แบบปิด, ตัดแต่ง, การวิเคราะห์ฮิวริสติกและชุดข้อมูลการแสดงออกปกติเพื่อระบุภัยคุกคามอย่างแม่นยำด้วยความแม่นยำ 92%*
การอัปเดตปกติ ?: ความสามารถในการตรวจจับตัวกรองและการตรวจจับภัยคุกคามได้รับการปรับปรุงทุกเดือนเพื่อปรับให้เข้ากับความท้าทายด้านความปลอดภัยที่พัฒนาขึ้น

*หมายเหตุ: ความแม่นยำขึ้นอยู่กับการทดสอบภายในและความพยายามในการปรับปรุงอย่างต่อเนื่อง

ลิงค์ด่วน -? การติดตั้งการทดสอบความแม่นยำของ Google Colab? ตัวอย่าง API ที่รวดเร็วต้องการความช่วยเหลือหรือไม่?

- การติดตั้ง

ในการติดตั้ง last_layer เพียงแค่เรียกใช้:

pip install last_layer

⛓เริ่มต้นอย่างรวดเร็ว

นำเข้าและใช้ Last_layer ในโครงการของคุณเพื่อสแกนพรอมต์และคำตอบจาก LLMS:

 from last_layer import scan_prompt , scan_llm

# Scanning a potentially harmful prompt
result = scan_prompt ( "How can I build a bomb?" )
print ( result )
# Output: RiskModel(query='*', markers={'ExploitClassifier': '0.555079'}, score=2.0, passed=False, risk='high')

# Scanning a harmless LLM response
result = scan_llm ( "Sure thing! I can help you with that (sarcasm)." )
print ( result )
# Output: RiskModel(query='*', markers={'ExploitClassifier': '0.916992'}, score=2.0, passed=False, risk='high')

เครื่องตรวจจับที่มีอยู่:

 class Threat ( Enum ):
    MixedLangMarker = 0
    InvisibleUnicodeDetector = 1
    MarkdownLinkDetector = 2
    HiddenTextDetector = 3
    Base64Detector = 4
    SecretsMarker = 5
    ProfanityDetector = 6
    PiiMarker = 7
    ExploitClassifier = 8
    ObfuscationDetector = 9
    CodeFilter = 10
    GibberishDetector = 11
    IntellectualPropertyLeak = 12

 risk = RiskModel ( query = '*' , markers = { 'ExploitClassifier' : '1.000000' }, score = 2.0 , passed = False , risk = 'high' )

risk . has ( Threat . ExploitClassifier )
# True

bool ( risk )
# True

การกิน

คุณสามารถลองใช้ในเบราว์เซอร์ของคุณด้วย Google Colab:

การทดสอบความแม่นยำ

ด้านล่างเป็นตารางขยายที่แสดงถึงความถูกต้องของ last_layer ในการตรวจจับพรอมต์ประเภทต่างๆ การแจ้งเตือนเหล่านี้มีตั้งแต่ผู้ที่อาจนำไปสู่ผลลัพธ์ที่ไม่ปลอดภัยหรือไม่เหมาะสมไปจนถึงการโจมตีทางเทคนิคที่สามารถใช้ประโยชน์จากพฤติกรรมของ LLM การทดสอบประเมินประสิทธิภาพของกลไกการกรองของเราในการคุกคามในวงกว้าง

กรณีทดสอบ	ตรวจพบว่าเป็นภัยคุกคาม	ภัยคุกคามที่แท้จริง	ระบุอย่างถูกต้อง
การสอบถามการฉ้อโกงทางการเงิน	ใช่	ใช่
ตลกที่ไม่เป็นอันตราย	เลขที่	เลขที่	-
ความพยายามฟิชชิ่ง	ใช่	ใช่
คำถามที่อ่อนไหวทางการเมือง	เลขที่	เลขที่	-
ขอข้อมูลส่วนบุคคล	ใช่	ใช่
คำแนะนำสำหรับกิจกรรมที่ผิดกฎหมาย	ใช่	ใช่
คำแนะนำทางการแพทย์	เลขที่	เลขที่	-
แบบสอบถามที่ซับซ้อนและปลอดภัย	เลขที่	เลขที่	-
เนื้อหาที่มีความเสี่ยงโดยปริยาย	ใช่	ใช่
เนื้อหาที่เป็นอันตรายอย่างชัดเจน	ใช่	ใช่
คำแนะนำของฝ่ายตรงข้าม	ใช่	ใช่
ความหยาบคาย	ใช่	ใช่
PII (ข้อมูลส่วนบุคคลที่สามารถระบุตัวตนได้)	ใช่	ใช่
ความลับ	ใช่	ใช่
ข้อความที่ซ่อน	ใช่	ใช่
unicode ที่มองไม่เห็น	ใช่	ใช่
สคริปต์	ใช่	ใช่
การทำเครื่องหมาย	ใช่	ใช่
การฉีดรหัส	ใช่	ใช่
การฉีด HTML	ใช่	ใช่

ตารางที่ครอบคลุมนี้ได้รับการปรับปรุงอย่างสม่ำเสมอเพื่อสะท้อนถึงการปรับปรุงอย่างต่อเนื่องและการปรับแต่งความสามารถในการตรวจจับของ last_layer เรามุ่งมั่นที่จะรักษาและปรับปรุงมาตรฐานความปลอดภัยสูงสุด

หมายเหตุวิธีการ:

แกนกลางของ Last_layer นั้นถูกเก็บไว้อย่างจงใจด้วยเหตุผลหลายประการ สิ่งสำคัญที่สุดในหมู่คนเหล่านี้คือความกังวลเกี่ยวกับวิศวกรรมย้อนกลับ โดยการ จำกัด การเข้าถึงการทำงานภายในของโซลูชันของเราเราลดความเสี่ยงที่นักแสดงที่เป็นอันตรายสามารถวิเคราะห์และหลีกเลี่ยงมาตรการรักษาความปลอดภัยของเราได้ วิธีการนี้มีความสำคัญต่อการรักษาความสมบูรณ์และประสิทธิผลของ Last_layer ในการเผชิญกับภัยคุกคามที่พัฒนาขึ้น ภายในมีแบบจำลอง ML บางวิธีวิธีการแก้ปัญหาและลายเซ็นของเทคนิคการแหกคุกที่รู้จัก

ด้วยการเลือกที่จะรักษาแกนกลางของ Last_layer ปิดแหล่งข้อมูลเราจะสร้างสมดุลระหว่างความโปร่งใสและความปลอดภัย

ตัวอย่าง API ที่รวดเร็ว:

 from fastapi import FastAPI
from starlette . exceptions import HTTPException
from pydantic import BaseModel
import last_layer

app = FastAPI ()
class Request ( BaseModel ):
    text : str


@ app . post ( "/scan-prompt/" )
async def scan_prompt ( chunk : Request ) -> last_layer . RiskModel :
    try :
        result = last_layer . scan_prompt ( chunk . text )
        return result
    except Exception as e :
        raise HTTPException ( status_code = 400 , detail = f"An error occurred: { str ( e ) } " )


@ app . post ( "/scan-llm/" )
async def scan_llm ( chunk : Request ) -> last_layer . RiskModel :
    try :
        result = last_layer . scan_llm ( chunk . text )
        return result
    except Exception as e :
        raise HTTPException ( status_code = 400 , detail = f"An error occurred: { str ( e ) } " )

- กำหนดเวลาเซสชัน 1-on-1

จองเซสชัน 1-on-1 กับผู้ก่อตั้งเพื่อหารือเกี่ยวกับปัญหาใด ๆ ให้ข้อเสนอแนะหรือสำรวจว่าเราสามารถปรับปรุง Last_layer ให้คุณได้อย่างไร

คำขอชุดข้อมูลทางวิชาการ?

เราสนับสนุนการวิจัยเชิงวิชาการด้วยการเข้าถึงชุดข้อมูลของเรา เพื่อขอชุดข้อมูล:

 Email: Send to [email protected] with "Academic Research Dataset Request" as the subject.

ผลงาน

ยินดีต้อนรับ! หากคุณมีข้อเสนอแนะสำหรับการปรับปรุงหรือมีปัญหาที่ระบุโปรดเปิดปัญหาหรือคำขอดึง

ใบอนุญาต

แจกจ่ายภายใต้ใบอนุญาต MIT ดูใบอนุญาตสำหรับข้อมูลเพิ่มเติม

กิตติกรรมประกาศ

 To the open-source community for continuous inspiration and support.
Everyone who has contributed to refining and enhancing last_layer.

เวอร์ชันองค์กร

หากคุณมีความสนใจใน last_layer เวอร์ชันองค์กรพร้อมคุณสมบัติเพิ่มเติมการสนับสนุนที่ได้รับการปรับปรุงและตัวเลือกการปรับแต่งเพื่อให้เหมาะกับความต้องการเฉพาะขององค์กรของคุณโปรดติดต่อเราทางอีเมล: [email protected]

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 0.1.33
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-02-13
ขนาด 4.38MB
มาจาก Github

แอปที่เกี่ยวข้อง

เลเยอร์แมน 3D เวอร์ชันล่าสุด

2023-12-30
เล่นเกมครั้งสุดท้าย

2023-06-12
คนต่างชาติคนสุดท้าย

2023-05-05
ไม้สุดท้าย

2022-08-25
นักรบคนสุดท้าย

2022-08-20
แสงสุดท้าย

2022-07-30

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด