Unduh last_layer - Unduh Kode Sumber last

last_layer

Kode Sumber AI

0.1.33

Unduh

Lapisan terakhir

Solusi Keamanan LLM yang sangat cepat dan rendah

last_layer adalah perpustakaan keamanan yang dirancang untuk melindungi aplikasi LLM dari serangan injeksi cepat, jailbreak, dan eksploitasi. Ini bertindak sebagai lapisan penyaringan yang kuat untuk meneliti petunjuk sebelum diproses oleh LLMS, memastikan bahwa hanya konten yang aman dan sesuai yang diizinkan melalui.

Catatan

 Please note that last_layer is designed as a safety tool and not a foolproof solution. It significantly reduces the risk of prompt-based attacks and exploits but cannot guarantee complete protection against all possible threats.

Fitur ?

Pemindaian ultra-cepat ⚡: Mencapai> = 2ms latensi untuk pemindaian injeksi/jailbreak yang cepat, pada CPU, memastikan dampak minimal pada pengalaman pengguna.
Fokus Privasi : Dirancang dengan mempertimbangkan privasi, last_layer beroperasi tanpa melacak atau melakukan panggilan jaringan, memastikan data tetap dalam infrastruktur Anda, ukuran paket di bawah 50 MB.
Sverless-Ready ☁️: Kompatibel dengan platform serverless seperti Vercel atau AWS Lambda.
Mekanisme Deteksi Lanjutan ‍♂️: Memanfaatkan kombinasi model automl yang tertutup, dipangkas, analisis heuristik, dan set data ekspresi reguler untuk secara akurat mengidentifikasi ancaman dengan akurasi 92%*.
Pembaruan rutin ?: Logika filter dan kemampuan deteksi ancaman diperbarui setiap bulan untuk beradaptasi dengan tantangan keamanan yang berkembang.

*Catatan: Akurasi berdasarkan pengujian internal dan upaya peningkatan berkelanjutan.

Tautan cepat -? Instalasi Tes Akurasi Google Colab? Contoh API cepat membutuhkan bantuan?

? Instalasi

Untuk menginstal last_layer , cukup jalankan:

pip install last_layer

⛓️ Mulai cepat

Impor dan gunakan last_layer dalam proyek Anda untuk memindai petunjuk dan tanggapan dari LLMS:

 from last_layer import scan_prompt , scan_llm

# Scanning a potentially harmful prompt
result = scan_prompt ( "How can I build a bomb?" )
print ( result )
# Output: RiskModel(query='*', markers={'ExploitClassifier': '0.555079'}, score=2.0, passed=False, risk='high')

# Scanning a harmless LLM response
result = scan_llm ( "Sure thing! I can help you with that (sarcasm)." )
print ( result )
# Output: RiskModel(query='*', markers={'ExploitClassifier': '0.916992'}, score=2.0, passed=False, risk='high')

Detektor yang tersedia:

 class Threat ( Enum ):
    MixedLangMarker = 0
    InvisibleUnicodeDetector = 1
    MarkdownLinkDetector = 2
    HiddenTextDetector = 3
    Base64Detector = 4
    SecretsMarker = 5
    ProfanityDetector = 6
    PiiMarker = 7
    ExploitClassifier = 8
    ObfuscationDetector = 9
    CodeFilter = 10
    GibberishDetector = 11
    IntellectualPropertyLeak = 12

 risk = RiskModel ( query = '*' , markers = { 'ExploitClassifier' : '1.000000' }, score = 2.0 , passed = False , risk = 'high' )

risk . has ( Threat . ExploitClassifier )
# True

bool ( risk )
# True

Colab

Anda juga dapat mencobanya di browser Anda dengan Google Colab:

Tes akurasi

Di bawah ini adalah tabel yang diperluas yang mewakili keakuratan last_layer dalam mendeteksi berbagai jenis petunjuk. Permintaan ini berkisar dari yang berpotensi menyebabkan output yang tidak aman atau tidak pantas, hingga serangan teknis yang dapat mengeksploitasi perilaku LLM. Tes mengevaluasi efektivitas mekanisme penyaringan kami di seluruh spektrum ancaman yang luas.

Uji kasus	Terdeteksi sebagai ancaman	Ancaman aktual	Diidentifikasi dengan benar
Penyelidikan Penipuan Keuangan	Ya	Ya	✅
Lelucon yang tidak berbahaya	TIDAK	TIDAK	-
Upaya phishing	Ya	Ya	✅
Pertanyaan yang sensitif secara politis	TIDAK	TIDAK	-
Meminta informasi pribadi	Ya	Ya	✅
Instruksi untuk aktivitas ilegal	Ya	Ya	✅
Nasihat medis	TIDAK	TIDAK	-
Secara teknis kompleks, permintaan yang aman	TIDAK	TIDAK	-
Konten berisiko implisit	Ya	Ya	✅
Konten berbahaya secara eksplisit	Ya	Ya	✅
Instruksi permusuhan	Ya	Ya	✅
Kata -kata kotor	Ya	Ya	✅
PII (Informasi Identifikasi Pribadi)	Ya	Ya	✅
Rahasia	Ya	Ya	✅
Teks tersembunyi	Ya	Ya	✅
Unicode yang tidak terlihat	Ya	Ya	✅
Skrip	Ya	Ya	✅
Penurunan harga	Ya	Ya	✅
Injeksi Kode	Ya	Ya	✅
Injeksi HTML	Ya	Ya	✅

Tabel komprehensif ini secara teratur diperbarui untuk mencerminkan peningkatan yang sedang berlangsung dan penyesuaian kemampuan deteksi last_layer . Kami bertujuan untuk mempertahankan dan meningkatkan standar keamanan tertinggi

Catatan Pendekatan:

Inti dari last_layer sengaja disimpan sumber tertutup karena beberapa alasan. Yang terpenting di antara ini adalah kekhawatiran terhadap rekayasa terbalik. Dengan membatasi akses ke pekerjaan dalam solusi kami, kami secara signifikan mengurangi risiko bahwa aktor jahat dapat menganalisis dan menghindari langkah -langkah keamanan kami. Pendekatan ini sangat penting untuk mempertahankan integritas dan efektivitas last_layer dalam menghadapi ancaman yang berkembang. Secara internal, ada model ML ramping, metode heuristik, dan tanda tangan teknik jailbreak yang dikenal.

Dengan memilih untuk menjaga inti dari Sumber Tertutup Last_Layer, kami mencapai keseimbangan antara transparansi dan keamanan.

Contoh API Cepat:

 from fastapi import FastAPI
from starlette . exceptions import HTTPException
from pydantic import BaseModel
import last_layer

app = FastAPI ()
class Request ( BaseModel ):
    text : str


@ app . post ( "/scan-prompt/" )
async def scan_prompt ( chunk : Request ) -> last_layer . RiskModel :
    try :
        result = last_layer . scan_prompt ( chunk . text )
        return result
    except Exception as e :
        raise HTTPException ( status_code = 400 , detail = f"An error occurred: { str ( e ) } " )


@ app . post ( "/scan-llm/" )
async def scan_llm ( chunk : Request ) -> last_layer . RiskModel :
    try :
        result = last_layer . scan_llm ( chunk . text )
        return result
    except Exception as e :
        raise HTTPException ( status_code = 400 , detail = f"An error occurred: { str ( e ) } " )

? Jadwalkan sesi 1-ke-1

Pesan sesi 1-on-1 dengan para pendiri, untuk membahas masalah apa pun, berikan umpan balik, atau jelajahi bagaimana kami dapat meningkatkan last_layer untuk Anda.

Permintaan Dataset Akademik?

Kami mendukung penelitian akademik dengan akses ke set data kami. Untuk meminta dataset:

 Email: Send to [email protected] with "Academic Research Dataset Request" as the subject.

Kontribusi

Kontribusi dipersilakan! Jika Anda memiliki saran untuk perbaikan atau telah mengidentifikasi masalah, silakan buka masalah atau permintaan tarik.

Lisensi

Didistribusikan di bawah lisensi MIT. Lihat lisensi untuk informasi lebih lanjut.

Ucapan Terima Kasih

 To the open-source community for continuous inspiration and support.
Everyone who has contributed to refining and enhancing last_layer.

Versi Perusahaan

Jika Anda tertarik pada versi perusahaan last_layer dengan fitur tambahan, dukungan yang ditingkatkan, dan opsi kustomisasi agar sesuai dengan kebutuhan spesifik organisasi Anda, hubungi kami melalui email: [email protected]

Memperluas

Informasi Tambahan

Versi 0.1.33
Tipe Kode Sumber AI
Waktu Pembaruan 2025-02-13
ukuran 4.38MB
Berasal dari Github

Aplikasi Terkait

Lapisan Manusia 3D versi terbaru

2023-12-30
permainan terakhir

2023-06-12
Orang Luar Terakhir

2023-05-05
Kayu Terakhir

2022-08-25
Prajurit Terakhir

2022-08-20
Cahaya Terakhir

2022-07-30

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua