GenAI LaTeX Proofreader是一款自動化工具,它使用生成式 AI 來校對以 LaTeX 編寫的科學論文並提出改進建議。這些建議將附加到原始 LaTeX 原始檔中,以建立校對報告。該工具主要供撰寫科學論文的作者使用。
更詳細地說,產生的校對報告包含正在審查的原始論文,並在每個部分的開頭附有建議清單。對於每個部分,回饋都是從不同校對角色的角度創建的。例如,在撰寫論文時,這些可以是「領域專家」、「英語語言專家」和「圖書編輯」。然而,根據論文的主題,角色還可以包括其他角色,例如「統計審查者」、「LaTeX 專家」或「包容性語言專家」等。
這裡的「校對」應作廣義解釋。雖然目前的大型語言模型 (LLM) 具有對邏輯、數學和物理的理解,但不應信任 LLM 對科學結果進行認真的校對。因此,任何建議都應該經過嚴格評估。另一方面,對於熟悉某個主題的作者來說,產生的報告可用於衡量法學碩士對正在審查的論文的推理程度。
GenAI LaTeX Proofreader 需要訂閱 Anthropic API。
對於開發和測試,GenAI LaTeX Proofreader 定期透過校對兩份試卷進行評估:
更詳細地說,這些論文針對此儲存庫中所有手動觸發的 CI 運行進行了校對。因此,您可以檢查 Github 上最近運行的 CI 管道產生的校對報告 ( report.pdf
):
完全自動校對 LaTeX 文件。
除上述之外,還可以新增其他校對角色。然而,目前這需要編輯 Python 原始碼。
使用不同的人工智慧角色進行校對的想法受到 Ethan Mollick 於 4/2024 出版的書《共同智慧:與人工智慧一起生活和工作》的啟發。
section{..}
之前的內容將不會被校對。section*{..}
。請注意,這項工作是概念的早期證明,因此可能需要熟悉開發工具(git、Python、Docker、Anthropic API 存取)才能使其正常運作。
以下步驟(適用於基於 Mac/Linux 的系統)說明如何校對論文:
第 1 步:克隆儲存庫
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
步驟 2: 建置 Docker 容器(使用 Python 和 Latex)
(cd .devcontainer/latex ; make build)
步驟 3:為 Anthropic API 設定秘密令牌,請參閱 https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(注意:不要共享您的ANTHROPIC_API_KEY
)
步驟 4:將建構論文所需的檔案複製到儲存庫中的「paper-to-proofread」子目錄中。
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
為了進行測試,您可以使用儲存庫中提供的虛擬紙張tests/integration/assets/empty_paper.tex
。
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(注意:請始終備份您的論文。)
第 5 步:運行genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
對於中等尺寸的紙張,這將需要幾分鐘的時間。如果一切正常,校對報告可以在output/report.pdf
中找到。
根據論文的主題,您可能需要調整定義校對角色的提示。目前提示需要直接在Python原始碼中編輯。
GenAI LaTeX Proofreader使用 GenAI(生成式 AI)和大語言模型 (LLM) 來自動校對科學論文。截至2024年,GenAI是一項快速發展的技術,發展迅速。
以下的清單包含一些關於該主題的參考文獻和相關著作,以及更廣泛地關於使用人工智慧進行科學發現的參考文獻和相關著作:
12/2023,微軟研究院,大型語言模型對科學發現的影響:使用 GPT-4 的初步研究
10/2023,W. Liang 等人,大型語言模型能否為研究論文提供有用的回饋?大規模實證分析
6/2023,人工智慧輔助數學推理:美國國家科學院組織的研討會。
歡迎貢獻、回饋或想法!
請隨時與我聯繫或在此存儲庫中提出問題。
(這個問題超出了我的專業範圍。)
圍繞使用人工智慧內容的指南和實踐仍在不斷發展。但是,要在學術環境中發表作品,請先諮詢您的顧問、部門、期刊和/或大學。
另請注意:
「GenAI LaTeX Proofreader」版權所有 2024 Matias Dahl(及貢獻者),並根據 MIT 開源授權條款分發。
這項工作的部分內容是使用人工智慧工具開發的。
有關詳細信息,請參閱 LICENSE 文件。