genai latex proofreader下载 - genai latex proofreader源码下载

genai latex proofreader

Ai源码

1.0.0

下载

GenAI LaTeX 校对器

GenAI LaTeX Proofreader是一款自动化工具，它使用生成式 AI 来校对以 LaTeX 编写的科学论文并提出改进建议。这些建议将附加到原始 LaTeX 源文件中，创建校对报告。该工具主要供撰写科学论文的作者使用。

更详细地说，生成的校对报告包含正在审查的原始论文，并在每个部分的开头附有建议列表。对于每个部分，反馈都是从不同校对角色的角度创建的。例如，在撰写论文时，这些可以是“领域专家”、“英语语言专家”和“图书编辑”。然而，根据论文的主题，角色还可以包括其他角色，例如“统计审稿人”、“LaTeX 专家”或“包容性语言专家”等。

这里的“校对”应作广义解释。虽然当前的大型语言模型 (LLM) 具有对逻辑、数学和物理的理解，但不应信任 LLM 对科学结果进行认真的校对。因此，任何建议都应该经过严格评估。另一方面，对于熟悉某个主题的作者来说，生成的报告可用于衡量法学硕士对正在审查的论文的推理程度。

GenAI LaTeX Proofreader 需要订阅 Anthropic API。

校对报告示例

对于开发和测试，GenAI LaTeX Proofreader 定期通过校对两份试卷进行评估：

空纸：没有实质内容的纸。
arxiv:1108.4207：我早期论文之一的预印本。

更详细地说，这些论文针对此存储库中所有手动触发的 CI 运行进行了校对。因此，您可以检查 Github 上最近运行的 CI 管道生成的校对报告 ( report.pdf )：

CI 运行示例 2024.06.30
所有运行均生成报告
注意：下载生成的报告需要您登录 Github。

特征

完全自动校对 LaTeX 文档。

要创建校对报告，只需运行Python脚本，该脚本将调用GenAI API并自动生成校对报告。注释会自动插入到输入的 LaTeX 文件中并编译成 pdf。
例如，如果论文在 GitHub 中受到版本控制，则每当签入论文的新版本时，就可以使用 GitHub 运行程序自动生成校对报告。

支持的校对角色

✅ 领域专家（已实施）

批判性地评估每个部分的正确性和清晰度。找出优势、劣势，并为今后的工作提出建议。
还要评估标题、摘要和引言与论文其余部分内容的匹配程度。
此处按提示执行。

✅ 语言专家（已实现）

校对内容的拼写错误、措辞、语法和流程。
此处按提示执行。

？图书编辑器（尚未实现）

评估论文的高层组织。

？ LaTeX 专家（尚未实施）

提供有关您使用 LaTeX 的反馈。

？期刊同行评审（尚未实施）

请参阅下面参考文献中的 https://arxiv.org/abs/2310.01783。

？自定义校对角色

除上述之外，还可以添加其他校对角色。然而，目前这需要编辑 Python 源代码。

使用不同的人工智能角色进行校对的想法受到 Ethan Mollick 于 4/2024 出版的书《共同智能：与人工智能一起生活和工作》的启发。

局限性

假定本文的某些结构。例如
- 第一个section{..}之前的内容将不会被校对。
- 不支持未编号的部分section*{..} 。
- 校对者将看不到任何包含文件的内容。
GenAI 不会看到或理解任何图像或参考。
校对报告不会是确定性的。使用相同输入文档的不同运行可能会生成不同的报告。
有多家提供商提供法学硕士课程，例如 OpenAI、Anthropic、Google。目前仅支持 Anthropic。
您的论文将通过互联网发送给法学硕士提供商。请仔细阅读他们的服务条款。
使用法学硕士也会产生一些费用。
使用 pdflatex 和 TexLive。 arxiv 也使用 TexLive，链接。
LLM 提供的校对意见在某些情况下会包含 LaTeX 错误。 GenAI LaTeX Proofreader 将尝试修复这些问题。但在某些情况下，校对报告可能无法编译。

入门

请注意，这项工作是概念的早期证明，因此可能需要熟悉开发工具（git、Python、Docker、Anthropic API 访问）才能使其正常工作。

以下步骤（适用于基于 Mac/Linux 的系统）描述了如何校对论文：

第 1 步：克隆存储库

git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader

第 2 步：构建 Docker 容器（使用 Python 和 Latex）

(cd .devcontainer/latex ; make build)

步骤 3：为 Anthropic API 设置秘密令牌，请参阅 https://docs.anthropic.com/en/docs/quickstart

 export ANTHROPIC_API_KEY= ' your-secret-api-key-here '

（注意：不要共享您的ANTHROPIC_API_KEY ）

第 4 步：将构建论文所需的文件复制到存储库中的“paper-to-proofread”子目录中。

mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread

为了进行测试，您可以使用存储库中提供的虚拟纸张tests/integration/assets/empty_paper.tex 。

mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/

（注意：请始终备份您的论文。）

第 5 步：运行genai-latex-proofreader

(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)

对于中等尺寸的纸张，这将需要几分钟的时间。如果一切正常，校对报告可以在output/report.pdf中找到。

配置和定制

根据论文的主题，您可能需要调整定义校对角色的提示。目前提示需要直接在Python源代码中编辑。

生成式人工智能

GenAI LaTeX Proofreader使用 GenAI（生成式 AI）和大语言模型 (LLM) 来自动校对科学论文。截至2024年，GenAI是一项快速发展的技术，发展迅速。

下面的列表包含有关该主题的一些参考文献和相关著作，以及更广泛地关于使用人工智能进行科学发现的参考文献和相关著作：

12/2023，微软研究院，大型语言模型对科学发现的影响：使用 GPT-4 的初步研究
- https://arxiv.org/pdf/2311.07361
10/2023，W. Liang 等人，大型语言模型能否为研究论文提供有用的反馈？大规模实证分析
- https://arxiv.org/abs/2310.01783
- https://github.com/Weixin-Liang/LLM-scientific-feedback
6/2023，人工智能辅助数学推理：美国国家科学院组织的研讨会。
- https://www.nationalacademies.org/event/06-12-2023/ai-to-assist-mathematical-reasoning-a-workshop
- 作为研讨会的一部分收集的资源集合：https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit