漸變_RAG
1.0.0
該儲存庫包含與檢索增強生成 (RAG) 相關的程式碼和資源,該技術旨在解決 Llama-2 等大型語言模型 (LLM) 中的資料新鮮度問題。法學碩士通常缺乏對最近發生的事件和最新資訊的了解。 RAG 將知識庫中的外部知識納入 LLM 回答中,從而實現準確且有根據的答案。
src
:包含用於實現 RAG 技術以及與知識庫互動的原始程式碼。data
:儲存用於建立知識庫的資料集和相關資源。db
:管理和儲存用於知識庫搜尋的標記嵌入或向量表示。requirements.txt
:執行此儲存庫中的程式碼所需的Python套件。 RAG 是一種新穎的方法,將大型語言模型 (LLM) 功能與外部知識庫結合,以提高生成回應的品質和新鮮度。它透過從外部來源檢索上下文相關知識並將其合併到法學碩士生成的內容中來解決過時資訊的挑戰。
Gradio 是一個 Python 函式庫,可協助您快速為機器學習模型建立 UI。它允許您快速部署模型並透過用戶友好的介面存取它們,而無需進行大量的前端開發。
當gradio_chatbot.py
程式碼運行時,Gradio 應用程式就會啟動。它包含可修改的元素,例如嵌入模型、生成模型、可編輯系統提示以及所選 LLM 的可調參數。
若要使用此儲存庫中的程式碼,請按照下列步驟操作:
將儲存庫克隆到本機。
使用命令列導航到儲存庫目錄。
使用以下命令安裝所需的軟體包:
pip install -r requirements.txt
使用以下命令運行聊天機器人應用程式:
python src/gradio_chatbot.py
Gradio 應用程式啟動後,上傳文件(pdf 或 csv),選擇模型(嵌入和生成),調整可調參數,擺弄系統提示,並詢問您需要的任何資訊!