渐变_RAG
1.0.0
该存储库包含与检索增强生成 (RAG) 相关的代码和资源,该技术旨在解决 Llama-2 等大型语言模型 (LLM) 中的数据新鲜度问题。法学硕士通常缺乏对最近发生的事件和最新信息的了解。 RAG 将知识库中的外部知识纳入 LLM 回答中,从而实现准确且有根据的回答。
src
:包含用于实现 RAG 技术以及与知识库交互的源代码。data
:存储用于构建知识库的数据集和相关资源。db
:管理和存储用于知识库搜索的标记嵌入或向量表示。requirements.txt
:运行此存储库中的代码所需的Python包。 RAG 是一种新颖的方法,将大型语言模型 (LLM) 功能与外部知识库相结合,以提高生成响应的质量和新鲜度。它通过从外部来源检索上下文相关知识并将其合并到法学硕士生成的内容中来解决过时信息的挑战。
Gradio 是一个 Python 库,可帮助您快速为机器学习模型创建 UI。它允许您快速部署模型并通过用户友好的界面访问它们,而无需进行大量的前端开发。
当gradio_chatbot.py
代码运行时,Gradio 应用程序就会启动。它包含可修改的元素,例如嵌入模型、生成模型、可编辑系统提示以及所选 LLM 的可调参数。
要使用此存储库中的代码,请按照下列步骤操作:
将存储库克隆到本地计算机。
使用命令行导航到存储库目录。
使用以下命令安装所需的软件包:
pip install -r requirements.txt
使用以下命令运行聊天机器人应用程序:
python src/gradio_chatbot.py
Gradio 应用程序启动后,上传文档(pdf 或 csv),选择模型(嵌入和生成),调整可调参数,摆弄系统提示,并询问您需要的任何信息!