arXivRAG は、 arXiv データベースからの学術コンテンツの検索と生成を強化するために設計された包括的なツールです。 arXivRAG は、高度な検索拡張生成 (RAG) 技術を活用して、研究者、学生、愛好家に、arXiv 論文の要約、洞察、分析を効率的に発見して生成する機能を提供します。
検索拡張生成: 検索システムの機能と生成モデルを組み合わせて、応答の精度と関連性を高めます。
arXiv 統合: arXiv リポジトリに直接クエリを実行して、学術論文を取得して要約します。
ユーザーフレンドリーなインターフェイス: 科学論文の概要をクエリして取得するための使いやすいインターフェイスを提供します。
カスタマイズ可能: ユーザーは、特定のニーズに合わせて取得パラメータと生成パラメータをカスタマイズできます。
拡張検索: 関連する論文をすばやく見つけるための高度な検索機能。
要約: arXiv 論文の簡潔な要約を自動生成します。
カスタム クエリ: 学術論文から特定の情報を取得するためのカスタマイズされたクエリのサポート。
リアルタイム アクセス: リアルタイム データ アクセスのための arXiv API とのシームレスな統合。
引用と傾向の分析: 引用ネットワークを分析し、論文の影響を視覚化し、最近の出版物と引用パターンに基づいて新たな研究トレンドを特定します。
arXivRAG の使用を開始するには、次の手順に従います。
リポジトリのクローンを作成します。
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
仮想環境を作成します (conda の使用をお勧めします)。
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
必要な依存関係をインストールします。
pip install -r requirements.txt
arXivRAG を使用するには、次の手順に従います。
メイン スクリプトを実行します。
python main.py
システムにクエリを実行します。
科学論文に関する質問を入力してください。
システムは、arXiv から関連する論文を取得し、要約を生成します。
構成ファイルconfig.yaml
変更することで、arXivRAG の動作をカスタマイズできます。主要なパラメータは次のとおりです。
retrieval_model : 関連する論文を検索するために使用されるモデル。
Generation_model : サマリーの生成に使用されるモデル。
num_retrievals : 各クエリで取得する論文の数。
max_summary_length : 生成されるサマリーの最大長。
コミュニティからの貢献を歓迎します!新しい機能や改善に関するアイデアがある場合は、お気軽にイシューをオープンするか、プル リクエストを送信してください。
プル リクエストを送信する場合は、次の手順に従ってください。
リポジトリをフォークします。
新しいブランチを作成します。
git checkout -b feature/your-feature-name
変更を加えてコミットします。
git commit -m "Add your commit message"
ブランチにプッシュします。
git push origin feature/your-feature-name
プルリクエストを作成します。
このプロジェクトは、Apache 2.0 ライセンスに基づいてリリースされています。詳細については、LICENSE ファイルを参照してください。
arXivRAG プロジェクトの貢献者に感謝します。
このプロジェクトで使用された検索モデルと生成モデルの開発者に特に感謝します。