Explore RAG
1.0.0
该项目演示了使用 Python 进行文档检索的各种检索技术。实现的技术包括 HyDe、Basic、倒数排序融合 (RRF)、融合检索和子查询分解 (SQD)。该项目使用 Streamlit 作为用户界面,并使用各种库进行文档处理和检索。
克隆存储库:
git clone https://github.com/yourusername/yourrepository.git
cd yourrepository
安装所需的依赖项:
pip install -r requirements.txt
运行 Streamlit 应用程序:
streamlit run app.py
使用侧边栏上传 PDF 文件。
从侧栏中选择检索技术。
在文本输入框中输入查询并查看检索到的文档。
HyDe(假设文档)检索根据查询生成假设文档并检索相似文档。
基本检索使用简单的相似性搜索来根据查询检索文档。
倒数排名融合(RRF)结合了多种检索算法的结果,以提高整体检索性能。
融合检索使用加权和将矢量搜索和 BM25 搜索结果结合起来,以检索最相关的文档。
子查询分解(SQD)是一种将查询分解为子查询并根据子查询检索文档的技术。
欢迎贡献!请提出问题或提交拉取请求以进行任何改进或错误修复。
该项目已获得 MIT 许可证的许可。有关更多详细信息,请参阅LICENSE
文件。