guardrails demo
1.0.0
该存储库提供了一种快速简便的方法来在本地计算机上运行 Llama Guard 应用程序并探索 LLM 安全性。
Llama Guard 是一个防御框架,旨在检测和减轻与大型语言模型 (LLM) 相关的潜在安全风险。它帮助开发人员和研究人员构建更安全、更可靠的法学硕士应用程序。
Nemo Guardrail 实施: llama-guard 文件夹包含 NeMo Guardrail 实施,为您的特定需求提供灵活性和自定义。 Streamlit 应用程序:提供了两个 Streamlit 应用程序以方便测试: llama-guard-only.py:直接使用 Llama Guard 测试输入提示和响应。 llama_2_with_llama-guard.py:使用预先训练的 Llama 2 13b 模型运行 Llama Guard 进行实际测试。
博客文章:通过这篇内容丰富的博客文章加深您对 Llama Guard 和 LLM 安全性的理解:https://balavenkatesh.medium.com/securing-tomorrows-ai-world-today-llama-guard-defective-strategies-for-llm-应用程序-c29a87ba607f