arXivRAG是一款綜合工具,旨在增強 arXiv 資料庫中學術內容的檢索和產生。 arXivRAG 利用先進的檢索增強生成 (RAG) 技術,為研究人員、學生和愛好者提供高效發現和生成 arXiv 論文摘要、見解和分析的能力。
檢索增強生成:將檢索系統的功能與生成模型結合,以提高回應的準確性和相關性。
arXiv 整合:直接查詢 arXiv 儲存庫以取得和總結學術論文。
使用者友善的介面:提供易於使用的介面,用於查詢和獲取科學論文摘要。
可自訂:允許使用者自訂檢索和生成參數以滿足他們的特定需求。
增強搜尋:進階搜尋功能可快速找到相關論文。
摘要:自動產生 arXiv 論文的簡明摘要。
自訂查詢:自訂查詢支援以從學術論文中檢索特定資訊。
即時存取:與 arXiv API 無縫集成,實現即時資料存取。
引文和趨勢分析:分析引文網絡,可視化論文的影響,並根據最近的出版物和引文模式識別新興的研究趨勢。
若要開始使用 arXivRAG,請依照下列步驟操作:
克隆儲存庫:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
創建虛擬環境(我們推薦使用conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
安裝所需的依賴項:
pip install -r requirements.txt
若要使用 arXivRAG,請依照下列步驟操作:
運行主腳本:
python main.py
查詢系統:
輸入與科學論文相關的查詢。
系統將從 arXiv 檢索相關論文並產生摘要。
您可以透過修改設定檔config.yaml
來自訂 arXivRAG 的行為。關鍵參數包括:
retrieval_model :用於檢索相關論文的模型。
Generation_model :用於產生摘要的模型。
num_retrievals :每次查詢要檢索的論文數量。
max_summary_length :產生的摘要的最大長度。
我們歡迎社區的貢獻!如果您對新功能或改進有任何想法,請隨時提出問題或提交拉取請求。
如果您想提交拉取請求,請按照以下步驟操作:
分叉儲存庫。
建立一個新分支:
git checkout -b feature/your-feature-name
進行更改並提交:
git commit -m "Add your commit message"
推送到分支:
git push origin feature/your-feature-name
建立拉取請求。
該專案是在 Apache 2.0 許可證下發布的。有關詳細信息,請參閱許可證文件。
感謝 arXivRAG 計畫的貢獻者。
特別感謝該專案中使用的檢索和生成模型的開發人員。