GenAI LaTeX Proofreader es una herramienta automatizada que utiliza IA generativa para corregir y sugerir mejoras a artículos científicos escritos en LaTeX. Las sugerencias se adjuntan al archivo fuente original de LaTeX creando un informe de revisión. Esta herramienta está destinada principalmente a autores que trabajan en un artículo científico.
Más detalladamente, el informe de revisión generado contiene el artículo original que se está revisando, con una lista de sugerencias adjunta al comienzo de cada sección. Para cada sección, los comentarios se crean desde la perspectiva de diferentes personas correctoras. Por ejemplo, al escribir un artículo, estos podrían ser "Experto en el dominio", "Experto en el idioma inglés" y "Editor de libros". Sin embargo, las personas también podrían incluir personas adicionales como "revisor estadístico", "especialista en LaTeX" o "experto en lenguaje inclusivo", etc., según el tema del artículo.
En este caso, el término "corrección" debe interpretarse de manera amplia. Si bien los modelos de lenguajes grandes (LLM) actuales tienen conocimientos de lógica, matemáticas y física, no se debe confiar en los LLM para la revisión seria de resultados científicos. Por tanto, cualquier sugerencia debe evaluarse críticamente. Por otro lado, para los autores familiarizados con un tema, el informe generado se puede utilizar para evaluar qué tan profundamente un LLM puede razonar sobre el artículo que se está revisando.
GenAI LaTeX Proofreader requiere una suscripción a Anthropic API.
Para el desarrollo y las pruebas, GenAI LaTeX Proofreader se evalúa periódicamente mediante la corrección de dos trabajos de prueba:
Con más detalle, estos documentos se revisan para todas las ejecuciones de CI activadas manualmente en este repositorio. Por lo tanto, puede inspeccionar los informes de revisión generados ( report.pdf
) de ejecuciones recientes de canalización de CI en Github:
Revisión completamente automatizada de documentos LaTeX.
Además de lo anterior, se pueden agregar otras personas correctoras. Sin embargo, esto actualmente requiere que se edite el código fuente de Python.
La idea de utilizar diferentes personajes de IA para la revisión está inspirada en el libro Co-Intelligence: Living and work with AI de Ethan Mollick, publicado en abril de 2024.
section{..}
no será revisado.section*{..}
.Tenga en cuenta que este trabajo es una prueba temprana de concepto, por lo que es posible que sea necesario cierta familiaridad con las herramientas de desarrollo (git, Python, Docker, acceso a Anthropic API) para que esto funcione.
Los pasos siguientes (para sistemas basados en Mac/Linux) describen cómo corregir un artículo:
Paso 1: clonar el repositorio
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
Paso 2: construir el contenedor Docker (con Python y Latex)
(cd .devcontainer/latex ; make build)
Paso 3: Configure el token secreto para la API de Anthropic, consulte https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(Nota: no comparta su ANTHROPIC_API_KEY
)
Paso 4: Copie los archivos necesarios para crear su artículo en el subdirectorio 'papel para corregir' en el repositorio.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
Para las pruebas, puede utilizar un documento ficticio tests/integration/assets/empty_paper.tex
proporcionado en el repositorio.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(Nota: tenga siempre una copia de seguridad de su documento).
Paso 5: Ejecute genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
Para un papel de tamaño mediano, esto llevará unos minutos. Si todo funcionó, el informe de revisión se puede encontrar en output/report.pdf
.
Dependiendo del tema de su artículo, es posible que desee ajustar las indicaciones que definen las personas de revisión. Actualmente, las indicaciones deben editarse directamente en el código fuente de Python.
GenAI LaTeX Proofreader utiliza GenAI (IA generativa) y modelos de lenguaje grande (LLM) para automatizar la revisión de artículos científicos. A partir de 2024, GenAI es una tecnología que evoluciona rápidamente con rápidos desarrollos.
La siguiente lista contiene algunas referencias y trabajos relacionados sobre este tema y, en términos más generales, sobre el uso de la IA para realizar descubrimientos científicos:
12/2023, Microsoft Research, El impacto de los modelos de lenguaje grandes en el descubrimiento científico: un estudio preliminar utilizando GPT-4
10/2023, W. Liang et al., ¿Pueden los modelos de lenguaje grandes proporcionar comentarios útiles sobre los artículos de investigación? Un análisis empírico a gran escala
6/2023, IA para ayudar al razonamiento matemático: un taller organizado por las Academias Nacionales de Ciencias.
¡Contribuciones, comentarios o ideas son bienvenidos!
No dude en ponerse en contacto conmigo o plantear un problema en este repositorio.
(Esta pregunta está fuera de mi área de especialización).
Las pautas y prácticas sobre el uso de contenido de IA aún están evolucionando. Sin embargo, para publicar trabajos en un entorno académico, consulte primero con su asesor, departamento, revista y/o universidad.
Tenga en cuenta también que:
"GenAI LaTeX Proofreader" tiene copyright 2024 de Matias Dahl (y colaboradores) y se distribuye según los términos de la licencia de código abierto del MIT.
Partes de este trabajo se han desarrollado utilizando herramientas impulsadas por IA.
Para obtener más información, consulte el archivo de LICENCIA.