arXivRAG ist ein umfassendes Tool zur Verbesserung des Abrufs und der Generierung akademischer Inhalte aus der arXiv-Datenbank. Durch den Einsatz fortschrittlicher RAG-Techniken (Retrieval-Augmented Generation) bietet arXivRAG Forschern, Studenten und Enthusiasten die Möglichkeit, Zusammenfassungen, Erkenntnisse und Analysen von arXiv-Artikeln effizient zu entdecken und zu generieren.
Retrieval-Augmented Generation : Kombiniert die Leistungsfähigkeit von Retrieval-Systemen mit generativen Modellen, um die Genauigkeit und Relevanz von Antworten zu verbessern.
arXiv-Integration : Fragt direkt das arXiv-Repository ab, um wissenschaftliche Arbeiten abzurufen und zusammenzufassen.
Benutzerfreundliche Oberfläche : Bietet eine benutzerfreundliche Oberfläche zum Abfragen und Abrufen von Zusammenfassungen wissenschaftlicher Arbeiten.
Anpassbar : Ermöglicht Benutzern die Anpassung der Abruf- und Generierungsparameter an ihre spezifischen Anforderungen.
Erweiterte Suche : Erweiterte Suchfunktionen zum schnellen Auffinden relevanter Artikel.
Zusammenfassung : Automatische Generierung prägnanter Zusammenfassungen für arXiv-Artikel.
Benutzerdefinierte Abfragen : Maßgeschneiderte Abfrageunterstützung zum Abrufen spezifischer Informationen aus wissenschaftlichen Arbeiten.
Echtzeitzugriff : Nahtlose Integration mit der arXiv-API für Echtzeit-Datenzugriff.
Zitier- und Trendanalyse : Analysieren Sie Zitiernetzwerke, visualisieren Sie die Wirkung von Artikeln und identifizieren Sie neue Forschungstrends auf der Grundlage aktueller Veröffentlichungen und Zitiermuster.
Um mit arXivRAG zu beginnen, befolgen Sie diese Schritte:
Klonen Sie das Repository:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Erstellen Sie eine virtuelle Umgebung (wir empfehlen die Verwendung von Conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r requirements.txt
Um arXivRAG zu verwenden, befolgen Sie diese Schritte:
Führen Sie das Hauptskript aus:
python main.py
Fragen Sie das System ab:
Geben Sie Ihre Anfrage zu einer wissenschaftlichen Arbeit ein.
Das System ruft relevante Dokumente von arXiv ab und erstellt eine Zusammenfassung.
Sie können das Verhalten von arXivRAG anpassen, indem Sie die Konfigurationsdatei config.yaml
ändern. Zu den wichtigsten Parametern gehören:
retrieval_model : Das Modell, das zum Abrufen relevanter Dokumente verwendet wird.
generation_model : Das Modell, das zum Generieren von Zusammenfassungen verwendet wird.
num_retrievals : Die Anzahl der für jede Abfrage abzurufenden Dokumente.
max_summary_length : Die maximale Länge der generierten Zusammenfassung.
Wir freuen uns über Beiträge aus der Community! Wenn Sie Ideen für neue Funktionen oder Verbesserungen haben, können Sie gerne ein Issue eröffnen oder eine Pull-Anfrage einreichen.
Wenn Sie einen Pull-Request einreichen möchten, befolgen Sie bitte diese Schritte:
Forken Sie das Repository.
Erstellen Sie einen neuen Zweig:
git checkout -b feature/your-feature-name
Nehmen Sie Ihre Änderungen vor und übernehmen Sie sie:
git commit -m "Add your commit message"
Zur Filiale schieben:
git push origin feature/your-feature-name
Erstellen Sie eine Pull-Anfrage.
Dieses Projekt wird unter der Apache 2.0-Lizenz veröffentlicht. Einzelheiten finden Sie in der LICENSE-Datei.
Vielen Dank an die Mitwirkenden des arXivRAG-Projekts.
Besonderer Dank geht an die Entwickler der in diesem Projekt verwendeten Abruf- und Generierungsmodelle.