GenAI LaTeX Proofreader est un outil automatisé qui utilise l'IA générative pour relire et suggérer des améliorations aux articles scientifiques rédigés en LaTeX. Les suggestions sont ajoutées au fichier source LaTeX original, créant ainsi un rapport de relecture. Cet outil est principalement destiné aux auteurs travaillant sur un article scientifique.
Plus en détail, le rapport de relecture généré contient l'article original en cours de révision, avec une liste de suggestions jointe au début de chaque section. Pour chaque section, des commentaires sont créés du point de vue de différents relecteurs. Par exemple, lors de la rédaction d'un article, il peut s'agir de « Expert du domaine », « Expert en langue anglaise » et « Éditeur de livre ». Cependant, les personnages peuvent également inclure des personnages supplémentaires tels que « réviseur statistique », « spécialiste LaTeX » ou « expert en langage inclusif », etc. en fonction du sujet de l'article.
Ici, la « relecture » doit être interprétée au sens large. Bien que les grands modèles de langage (LLM) actuels comprennent la logique, les mathématiques et la physique, il ne faut pas faire confiance aux LLM pour une relecture sérieuse des résultats scientifiques. Ainsi, toute suggestion doit être évaluée de manière critique. D'un autre côté, pour les auteurs familiers avec un sujet, le rapport généré peut être utilisé pour évaluer dans quelle mesure un LLM peut raisonner sur l'article en cours d'examen.
GenAI LaTeX Proofreader nécessite un abonnement à l'API Anthropic.
Pour le développement et les tests, GenAI LaTeX Proofreader est régulièrement évalué par la relecture de deux documents de test :
Plus en détail, ces articles sont relus pour toutes les exécutions de CI déclenchées manuellement dans ce dépôt. Ainsi, vous pouvez inspecter les rapports de relecture générés ( report.pdf
) à partir des exécutions récentes du pipeline CI sur Github :
Relecture entièrement automatisée des documents LaTeX.
En plus de ce qui précède, on peut ajouter d’autres personnages de relecture. Cependant, cela nécessite actuellement de modifier le code source de Python.
L'idée d'utiliser différents personnages d'IA pour la relecture est inspirée du livre d'Ethan Mollick Co-Intelligence : Living and working with AI publié en 4/2024.
section{..}
ne sera pas relu.section*{..}
.Notez que ce travail est une première preuve de concept, donc une certaine familiarité avec les outils de développement (git, Python, Docker, accès à l'API Anthropic) peut être nécessaire pour que cela fonctionne.
Les étapes ci-dessous (pour les systèmes Mac/Linux) décrivent comment relire un article :
Étape 1 : Cloner le dépôt
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
Étape 2 : Créer le conteneur Docker (avec Python et Latex)
(cd .devcontainer/latex ; make build)
Étape 3 : Configurez le jeton secret pour l'API Anthropic, voir https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(Remarque : ne partagez pas votre ANTHROPIC_API_KEY
)
Étape 4 : Copiez les fichiers requis pour créer votre article dans le sous-répertoire « papier à relire » du dépôt.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
Pour les tests, vous pouvez utiliser un papier factice tests/integration/assets/empty_paper.tex
fourni dans le dépôt.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(Remarque : veuillez toujours avoir une sauvegarde de votre document.)
Étape 5 : Exécutez genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
Pour un papier de format moyen, cela prendra quelques minutes. Si tout a fonctionné, le rapport de relecture se trouve dans output/report.pdf
.
En fonction du sujet de votre article, vous souhaiterez peut-être ajuster les invites qui définissent les personnages de relecture. Actuellement, les invites doivent être modifiées directement dans le code source Python.
GenAI LaTeX Proofreader utilise GenAI (Generative AI) et les grands modèles de langage (LLM) pour automatiser la relecture d'articles scientifiques. Depuis 2024, GenAI est une technologie en évolution rapide avec des développements rapides.
La liste ci-dessous contient quelques références et travaux connexes sur ce sujet, et plus largement sur l'utilisation de l'IA pour faire des découvertes scientifiques :
12/2023, Microsoft Research, L'impact des grands modèles linguistiques sur la découverte scientifique : une étude préliminaire utilisant GPT-4
10/2023, W. Liang et al., Les grands modèles de langage peuvent-ils fournir des commentaires utiles sur les articles de recherche ? Une analyse empirique à grande échelle
6/2023, L'IA pour assister le raisonnement mathématique : un atelier organisé par les Académies nationales des sciences.
Les contributions, commentaires ou idées sont les bienvenus !
N'hésitez pas à me contacter ou à soulever un problème dans ce dépôt.
(Cette question dépasse mon domaine d'expertise.)
Les directives et pratiques autour de l’utilisation du contenu IA continuent d’évoluer. Cependant, pour publier des travaux dans un cadre académique, veuillez d'abord vous référer à votre conseiller, département, revue et/ou université.
Veuillez également noter que :
"GenAI LaTeX Proofreader" est protégé par copyright 2024 Matias Dahl (et ses contributeurs) et distribué selon les termes de la licence open source MIT.
Certaines parties de ce travail ont été développées à l’aide d’outils basés sur l’IA.
Pour plus de détails, veuillez consulter le fichier LICENSE.