ArXiv Digest et recommandations personnalisées utilisant de grands modèles de langage.
Ce référentiel vise à fournir un meilleur résumé quotidien des articles arXiv récemment publiés, basé sur vos propres intérêts de recherche et des descriptions en langage naturel, en utilisant les évaluations de pertinence de GPT.
Vous pouvez l'essayer sur Hugging Face en utilisant votre propre clé API OpenAI.
Vous pouvez également créer un pipeline d'abonnement quotidien pour vous envoyer les résultats par courrier électronique.
Rester à jour sur les articles arXiv peut prendre un temps considérable, avec de l'ordre de centaines de nouveaux articles à filtrer chaque jour. Il existe un service officiel de résumé quotidien, mais les grandes catégories comme cs.AI ont encore 50 à 100 articles par jour. Déterminer si ces articles sont pertinents et importants pour vous signifie lire le titre et le résumé, ce qui prend du temps.
Ce référentiel propose une méthode pour organiser un résumé quotidien, trié par pertinence, à l'aide de grands modèles de langage. Ces modèles sont conditionnés en fonction de vos intérêts de recherche personnels, qui sont décrits en langage naturel.
config.yaml
avec un sujet arXiv, un ensemble de catégories et une déclaration en langage naturel sur le type d'articles qui vous intéresse.gpt-3.5-turbo-16k
.Nous proposons une démo sur https://huggingface.co/spaces/AutoLLM/ArxivDigest. Entrez simplement votre clé API OpenAI puis remplissez la configuration à droite. Notez que nous ne stockons pas votre clé.
Vous pouvez également vous envoyer un e-mail du résumé en créant un compte SendGrid et une clé API.
La méthode recommandée pour commencer à utiliser ce référentiel est la suivante :
config.yaml
et fusionnez les modifications dans votre branche principale.OPENAI_API_KEY
depuis OpenAISENDGRID_API_KEY
De SendGridFROM_EMAIL
Cette valeur doit correspondre à l'e-mail que vous avez utilisé pour créer la clé API SendGrid.TO_EMAIL
Voir Utilisation avancée pour plus de détails, y compris des images étape par étape, une personnalisation plus poussée et une utilisation alternative.
Pour exécuter localement la même interface utilisateur que l'espace Huggign Face :
src/requirements.txt
ainsi que gradio
.python src/app.py
et accédez à l'URL locale. De là, vous pourrez prévisualiser les articles d'aujourd'hui, ainsi que les résumés générés..env
pour vos secrets, vous pouvez copier .env.template
dans .env
, puis définir les variables d'environnement dans .env
..env.template
d'origine avec vos clés ou votre adresse e-mail, car .template.env
est suivi par git et sa modification pourrait vous amener à commettre vos secrets.AVERTISSEMENT : ne modifiez pas et ne validez pas votre
.env.template
avec vos clés personnelles ou votre adresse e-mail ! Cela pourrait les exposer au monde !
Vous pouvez (et êtes encouragé à) modifier le code de ce référentiel en fonction de vos besoins personnels. Si vous pensez que vos modifications seraient utiles à d'autres, veuillez soumettre une pull request.
Ces types de modifications incluent des éléments tels que des modifications apportées à l'invite, des modèles de langage différents ou des moyens supplémentaires pour que le résumé vous soit transmis.