ArXiv Digest und personalisierte Empfehlungen mithilfe großer Sprachmodelle.
Dieses Repo zielt darauf ab, eine bessere tägliche Übersicht über neu veröffentlichte arXiv-Artikel zu bieten, basierend auf Ihren eigenen Forschungsinteressen und Beschreibungen in natürlicher Sprache, unter Verwendung von Relevanzbewertungen von GPT.
Sie können es auf Hugging Face mit Ihrem eigenen OpenAI-API-Schlüssel ausprobieren.
Sie können auch eine tägliche Abonnementpipeline erstellen, um Ihnen die Ergebnisse per E-Mail zu senden.
Es kann eine beträchtliche Zeit in Anspruch nehmen, über arXiv-Artikel auf dem Laufenden zu bleiben, da jeden Tag Hunderte neuer Artikel gefiltert werden müssen. Es gibt einen offiziellen täglichen Zusammenfassungsdienst, große Kategorien wie cs.AI haben jedoch immer noch 50-100 Artikel pro Tag. Um festzustellen, ob diese Arbeiten für Sie relevant und wichtig sind, müssen Sie den Titel und die Zusammenfassung durchlesen, was zeitaufwändig ist.
Dieses Repository bietet eine Methode zum Kuratieren eines täglichen Digests, sortiert nach Relevanz, unter Verwendung großer Sprachmodelle. Diese Modelle basieren auf Ihren persönlichen Forschungsinteressen, die in natürlicher Sprache beschrieben werden.
config.yaml
mit einem arXiv-Betreff, einigen Kategorien und einer Erklärung in natürlicher Sprache über die Art der Aufsätze, an denen Sie interessiert sind.gpt-3.5-turbo-16k
auf einer Skala von 1 bis 10, wie relevant sie für Ihr Interesse sind.Wir bieten eine Demo unter https://huggingface.co/spaces/AutoLLM/ArxivDigest an. Geben Sie einfach Ihren OpenAI-API-Schlüssel ein und füllen Sie dann rechts die Konfiguration aus. Bitte beachten Sie, dass wir Ihren Schlüssel nicht speichern.
Sie können sich den Digest auch selbst per E-Mail senden, indem Sie ein SendGrid-Konto und einen API-Schlüssel erstellen.
Der empfohlene Einstieg in die Nutzung dieses Repositorys ist:
config.yaml
und führen Sie die Änderungen in Ihrem Hauptzweig zusammen.OPENAI_API_KEY
Von OpenAISENDGRID_API_KEY
Von SendGridFROM_EMAIL
Dieser Wert muss mit der E-Mail-Adresse übereinstimmen, die Sie zum Erstellen des SendGrid-API-Schlüssels verwendet haben.TO_EMAIL
Weitere Einzelheiten, einschließlich Schritt-für-Schritt-Bilder, weitere Anpassungen und alternative Verwendungsmöglichkeiten, finden Sie unter „Erweiterte Nutzung“.
So führen Sie lokal dieselbe Benutzeroberfläche wie den Huggign Face-Bereich aus:
src/requirements.txt
sowie in gradio
.python src/app.py
aus und gehen Sie zur lokalen URL. Von dort aus können Sie eine Vorschau der heutigen Beiträge sowie der generierten Zusammenfassungen anzeigen..env
Datei für Ihre Geheimnisse verwenden möchten, können Sie .env.template
nach .env
kopieren und dann die Umgebungsvariablen in .env
festlegen..env.template
nicht mit Ihren Schlüsseln oder Ihrer E-Mail-Adresse, da .template.env
von Git verfolgt wird und eine Bearbeitung dazu führen könnte, dass Sie Ihre Geheimnisse preisgeben.WARNUNG: Bearbeiten und übertragen Sie Ihre
.env.template
nicht mit Ihren persönlichen Schlüsseln oder Ihrer E-Mail-Adresse! Dies könnte diese der Welt zugänglich machen!
Sie können (und werden dazu ermutigt) den Code in diesem Repository an Ihre persönlichen Bedürfnisse anpassen. Wenn Sie der Meinung sind, dass Ihre Änderungen für andere in irgendeiner Weise nützlich wären, senden Sie bitte eine Pull-Anfrage.
Zu diesen Arten von Modifikationen gehören beispielsweise Änderungen an der Eingabeaufforderung, andere Sprachmodelle oder zusätzliche Möglichkeiten für die Übermittlung des Digests an Sie.