arXivRAG est un outil complet conçu pour améliorer la récupération et la génération de contenu académique à partir de la base de données arXiv. Tirant parti des techniques avancées de génération augmentée de récupération (RAG), arXivRAG offre aux chercheurs, aux étudiants et aux passionnés la possibilité de découvrir et de générer efficacement des résumés, des informations et des analyses d'articles arXiv.
Génération de récupération augmentée : combine la puissance des systèmes de récupération avec des modèles génératifs pour améliorer l'exactitude et la pertinence des réponses.
Intégration arXiv : interroge directement le référentiel arXiv pour récupérer et résumer les articles académiques.
Interface conviviale : Fournit une interface facile à utiliser pour interroger et obtenir des résumés d'articles scientifiques.
Personnalisable : permet aux utilisateurs de personnaliser les paramètres de récupération et de génération en fonction de leurs besoins spécifiques.
Recherche améliorée : capacités de recherche avancées pour trouver rapidement les articles pertinents.
Récapitulatif : génération automatique de résumés concis pour les articles arXiv.
Requêtes personnalisées : prise en charge de requêtes personnalisées pour récupérer des informations spécifiques à partir d'articles universitaires.
Accès en temps réel : intégration transparente avec l'API arXiv pour un accès aux données en temps réel.
Analyse des citations et des tendances : analysez les réseaux de citations, visualisez l'impact des articles et identifiez les tendances de recherche émergentes en fonction des publications récentes et des modèles de citation.
Pour démarrer avec arXivRAG, suivez ces étapes :
Clonez le dépôt :
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Créez un environnement virtuel (nous vous recommandons d'utiliser conda) :
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Installez les dépendances requises :
pip install -r requirements.txt
Pour utiliser arXivRAG, suivez ces étapes :
Exécutez le script principal :
python main.py
Interrogez le système :
Saisissez votre requête liée à un article scientifique.
Le système récupérera les articles pertinents d'arXiv et générera un résumé.
Vous pouvez personnaliser le comportement d'arXivRAG en modifiant le fichier de configuration config.yaml
. Les paramètres clés comprennent :
retrieval_model : Le modèle utilisé pour récupérer les articles pertinents.
Generation_model : Le modèle utilisé pour générer des résumés.
num_retrievals : Le nombre d'articles à récupérer pour chaque requête.
max_summary_length : La longueur maximale du résumé généré.
Nous apprécions les contributions de la communauté ! Si vous avez des idées de nouvelles fonctionnalités ou d'améliorations, n'hésitez pas à ouvrir un numéro ou à soumettre une pull request.
Si vous souhaitez soumettre une pull request, veuillez suivre ces étapes :
Forkez le référentiel.
Créez une nouvelle branche :
git checkout -b feature/your-feature-name
Apportez vos modifications et validez-les :
git commit -m "Add your commit message"
Poussez vers la succursale :
git push origin feature/your-feature-name
Créez une pull request.
Ce projet est publié sous la licence Apache 2.0. Voir le fichier LICENSE pour plus de détails.
Merci aux contributeurs du projet arXivRAG.
Un merci spécial aux développeurs des modèles de récupération et de génération utilisés dans ce projet.