Téléchargement prompt guard

Français

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Page d'accueil>Lié à la programmation>Code Source AI

prompt guard

Code Source AI

1.0.0

Télécharger

garde rapide

Prompt Guard est un modèle de classificateur de Meta, formé sur un grand corpus d'attaques, capable de détecter à la fois des invites explicitement malveillantes ( jailbreaks ) ainsi que des données contenant des entrées injectées ( injections rapides ). Lors de l'analyse, il renvoie un ou plusieurs des verdicts suivants, ainsi qu'un score de confiance pour chacun:

INJECTION
Jailbreak
BÉNIN

Ce référentiel contient une application Streamlit pour tester la garde de l'invite. Notez que vous aurez besoin d'un jeton d'accès HuggingFace pour accéder au modèle. Pour une rédaction plus détaillée, consultez cet article de blog.

Voici un échantillon de réponse par un garde rapide lors de la détection d'une tentative d'injection rapide.

injection de garde rapide