prompt guard
1.0.0
Rimple Guard - это модель классификатора Meta, обученная большому корпусу атак, способную обнаружить как явные злонамеренные подсказок ( джейлбрейки ), а также данные, которые содержат инъекционные входные данные ( быстрое инъекции ). После анализа он возвращает один или несколько из следующих вердиктов, а также оценку доверия для каждого:
Этот репозиторий содержит приложение для потоковой связи для тестирования быстрого охраны. Обратите внимание, что для доступа к модели вам понадобится токен доступа. Для более подробной рецензии см. В этом сообщении.
Вот образец ответа быстрого охраны после обнаружения оперативной попытки инъекции.
Вот образец ответа быстрого охраны после обнаружения попытки джейлбрейка.