GenAI LaTeX Proofreader是一款自动化工具,它使用生成式 AI 来校对以 LaTeX 编写的科学论文并提出改进建议。这些建议将附加到原始 LaTeX 源文件中,创建校对报告。该工具主要供撰写科学论文的作者使用。
更详细地说,生成的校对报告包含正在审查的原始论文,并在每个部分的开头附有建议列表。对于每个部分,反馈都是从不同校对角色的角度创建的。例如,在撰写论文时,这些可以是“领域专家”、“英语语言专家”和“图书编辑”。然而,根据论文的主题,角色还可以包括其他角色,例如“统计审稿人”、“LaTeX 专家”或“包容性语言专家”等。
这里的“校对”应作广义解释。虽然当前的大型语言模型 (LLM) 具有对逻辑、数学和物理的理解,但不应信任 LLM 对科学结果进行认真的校对。因此,任何建议都应该经过严格评估。另一方面,对于熟悉某个主题的作者来说,生成的报告可用于衡量法学硕士对正在审查的论文的推理程度。
GenAI LaTeX Proofreader 需要订阅 Anthropic API。
对于开发和测试,GenAI LaTeX Proofreader 定期通过校对两份试卷进行评估:
更详细地说,这些论文针对此存储库中所有手动触发的 CI 运行进行了校对。因此,您可以检查 Github 上最近运行的 CI 管道生成的校对报告 ( report.pdf
):
完全自动校对 LaTeX 文档。
除上述之外,还可以添加其他校对角色。然而,目前这需要编辑 Python 源代码。
使用不同的人工智能角色进行校对的想法受到 Ethan Mollick 于 4/2024 出版的书《共同智能:与人工智能一起生活和工作》的启发。
section{..}
之前的内容将不会被校对。section*{..}
。请注意,这项工作是概念的早期证明,因此可能需要熟悉开发工具(git、Python、Docker、Anthropic API 访问)才能使其正常工作。
以下步骤(适用于基于 Mac/Linux 的系统)描述了如何校对论文:
第 1 步:克隆存储库
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
第 2 步:构建 Docker 容器(使用 Python 和 Latex)
(cd .devcontainer/latex ; make build)
步骤 3:为 Anthropic API 设置秘密令牌,请参阅 https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(注意:不要共享您的ANTHROPIC_API_KEY
)
第 4 步:将构建论文所需的文件复制到存储库中的“paper-to-proofread”子目录中。
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
为了进行测试,您可以使用存储库中提供的虚拟纸张tests/integration/assets/empty_paper.tex
。
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(注意:请始终备份您的论文。)
第 5 步:运行genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
对于中等尺寸的纸张,这将需要几分钟的时间。如果一切正常,校对报告可以在output/report.pdf
中找到。
根据论文的主题,您可能需要调整定义校对角色的提示。目前提示需要直接在Python源代码中编辑。
GenAI LaTeX Proofreader使用 GenAI(生成式 AI)和大语言模型 (LLM) 来自动校对科学论文。截至2024年,GenAI是一项快速发展的技术,发展迅速。
下面的列表包含有关该主题的一些参考文献和相关著作,以及更广泛地关于使用人工智能进行科学发现的参考文献和相关著作:
12/2023,微软研究院,大型语言模型对科学发现的影响:使用 GPT-4 的初步研究
10/2023,W. Liang 等人,大型语言模型能否为研究论文提供有用的反馈?大规模实证分析
6/2023,人工智能辅助数学推理:美国国家科学院组织的研讨会。
欢迎贡献、反馈或想法!
请随时与我联系或在此存储库中提出问题。
(这个问题超出了我的专业范围。)
围绕使用人工智能内容的指南和实践仍在不断发展。但是,要在学术环境中发表作品,请首先咨询您的顾问、部门、期刊和/或大学。
另请注意:
“GenAI LaTeX Proofreader”版权所有 2024 Matias Dahl(及贡献者),并根据 MIT 开源许可条款分发。
这项工作的部分内容是使用人工智能工具开发的。
有关详细信息,请参阅 LICENSE 文件。