Explore RAG
1.0.0
本專案示範了使用 Python 進行文件檢索的各種檢索技術。實現的技術包括 HyDe、Basic、倒數排序融合 (RRF)、融合檢索和子查詢分解 (SQD)。該專案使用 Streamlit 作為使用者介面,並使用各種程式庫進行文件處理和檢索。
克隆儲存庫:
git clone https://github.com/yourusername/yourrepository.git
cd yourrepository
安裝所需的依賴項:
pip install -r requirements.txt
運行 Streamlit 應用程式:
streamlit run app.py
使用側邊欄上傳 PDF 檔案。
從側欄中選擇檢索技術。
在文字輸入框中輸入查詢並查看檢索到的文件。
HyDe(假設文件)會擷取根據查詢產生假設文件並檢索相似文件。
基本檢索使用簡單的相似性搜尋來根據查詢檢索文件。
倒數排名融合(RRF)結合了多種檢索演算法的結果,以提高整體檢索效能。
融合檢索使用加權和將向量搜尋和 BM25 搜尋結果結合起來,以檢索最相關的文件。
子查詢分解(SQD)是一種將查詢分解為子查詢並根據子查詢檢索文件的技術。
歡迎貢獻!請提出問題或提交拉取請求以進行任何改進或錯誤修復。
該項目已獲得 MIT 許可證的許可。有關更多詳細信息,請參閱LICENSE
文件。