arXivRAG是一款综合工具,旨在增强 arXiv 数据库中学术内容的检索和生成。 arXivRAG 利用先进的检索增强生成 (RAG) 技术,为研究人员、学生和爱好者提供高效发现和生成 arXiv 论文摘要、见解和分析的能力。
检索增强生成:将检索系统的功能与生成模型相结合,以提高响应的准确性和相关性。
arXiv 集成:直接查询 arXiv 存储库以获取和总结学术论文。
用户友好的界面:提供易于使用的界面,用于查询和获取科学论文摘要。
可定制:允许用户定制检索和生成参数以满足他们的特定需求。
增强搜索:高级搜索功能可快速找到相关论文。
摘要:自动生成 arXiv 论文的简明摘要。
自定义查询:定制查询支持以从学术论文中检索特定信息。
实时访问:与 arXiv API 无缝集成,实现实时数据访问。
引文和趋势分析:分析引文网络,可视化论文的影响,并根据最近的出版物和引文模式识别新兴的研究趋势。
要开始使用 arXivRAG,请按照以下步骤操作:
克隆存储库:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
创建虚拟环境(我们推荐使用conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
安装所需的依赖项:
pip install -r requirements.txt
要使用 arXivRAG,请按照下列步骤操作:
运行主脚本:
python main.py
查询系统:
输入与科学论文相关的查询。
系统将从 arXiv 检索相关论文并生成摘要。
您可以通过修改配置文件config.yaml
来自定义 arXivRAG 的行为。关键参数包括:
retrieval_model :用于检索相关论文的模型。
Generation_model :用于生成摘要的模型。
num_retrievals :每次查询要检索的论文数量。
max_summary_length :生成的摘要的最大长度。
我们欢迎社区的贡献!如果您对新功能或改进有想法,请随时提出问题或提交拉取请求。
如果您想提交拉取请求,请按照以下步骤操作:
分叉存储库。
创建一个新分支:
git checkout -b feature/your-feature-name
进行更改并提交:
git commit -m "Add your commit message"
推送到分支:
git push origin feature/your-feature-name
创建拉取请求。
该项目是在 Apache 2.0 许可证下发布的。有关详细信息,请参阅许可证文件。
感谢 arXivRAG 项目的贡献者。
特别感谢该项目中使用的检索和生成模型的开发人员。