genai latex proofreader下載 - genai latex proofreader源碼下載

genai latex proofreader

Ai源碼

1.0.0

下載

GenAI LaTeX 校對器

GenAI LaTeX Proofreader是一款自動化工具，它使用生成式 AI 來校對以 LaTeX 編寫的科學論文並提出改進建議。這些建議將附加到原始 LaTeX 原始檔中，以建立校對報告。該工具主要供撰寫科學論文的作者使用。

更詳細地說，產生的校對報告包含正在審查的原始論文，並在每個部分的開頭附有建議清單。對於每個部分，回饋都是從不同校對角色的角度創建的。例如，在撰寫論文時，這些可以是「領域專家」、「英語語言專家」和「圖書編輯」。然而，根據論文的主題，角色還可以包括其他角色，例如「統計審查者」、「LaTeX 專家」或「包容性語言專家」等。

這裡的「校對」應作廣義解釋。雖然目前的大型語言模型 (LLM) 具有對邏輯、數學和物理的理解，但不應信任 LLM 對科學結果進行認真的校對。因此，任何建議都應該經過嚴格評估。另一方面，對於熟悉某個主題的作者來說，產生的報告可用於衡量法學碩士對正在審查的論文的推理程度。

GenAI LaTeX Proofreader 需要訂閱 Anthropic API。

校對報告範例

對於開發和測試，GenAI LaTeX Proofreader 定期透過校對兩份試卷進行評估：

空紙：沒有實質內容的紙。
arxiv:1108.4207：我早期論文之一的預印本。

更詳細地說，這些論文針對此儲存庫中所有手動觸發的 CI 運行進行了校對。因此，您可以檢查 Github 上最近運行的 CI 管道產生的校對報告 ( report.pdf )：

CI 運行範例 2024.06.30
所有運行均產生報告
注意：下載產生的報告需要您登入 Github。

特徵

完全自動校對 LaTeX 文件。

若要建立校對報告，只需執行Python腳本，該腳本將呼叫GenAI API並自動產生校對報告。註釋會自動插入輸入的 LaTeX 檔案並編譯成 pdf。
例如，如果論文在 GitHub 中受到版本控制，則每當簽入論文的新版本時，就可以使用 GitHub 運行程式自動產生校對報告。

支援的校對角色

✅ 領域專家（已實施）

批判性地評估每個部分的正確性和清晰度。找出優勢、劣勢，並為未來的工作提出建議。
也要評估標題、摘要和引言與論文其餘部分內容的匹配程度。
此處按提示執行。

✅ 語言專家（已實現）

校對內容的拼字錯誤、措詞、文法和流程。
此處按提示執行。

？圖書編輯器（尚未實作）

評估論文的高層組織。

？ LaTeX 專家（尚未實施）

提供您使用 LaTeX 的回饋。

？期刊同儕審查（尚未實施）

請參閱下面參考文獻中的 https://arxiv.org/abs/2310.01783。

？自訂校對角色

除上述之外，還可以新增其他校對角色。然而，目前這需要編輯 Python 原始碼。

使用不同的人工智慧角色進行校對的想法受到 Ethan Mollick 於 4/2024 出版的書《共同智慧：與人工智慧一起生活和工作》的啟發。

限制

假定本文的某些結構。例如
- 第一個section{..}之前的內容將不會被校對。
- 不支援未編號的部分section*{..} 。
- 校對者將看不到任何包含文件的內容。
GenAI 不會看到或理解任何圖像或參考。
校對報告不會是確定性的。使用相同輸入文件的不同運行可能會產生不同的報告。
有多家供應商提供法學碩士課程，例如 OpenAI、Anthropic、Google。目前僅支援 Anthropic。
您的論文將透過網路發送給法學碩士提供者。請仔細閱讀他們的服務條款。
使用法學碩士也會產生一些費用。
使用 pdflatex 和 TexLive。 arxiv 也使用 TexLive，連結。
LLM 提供的校對意見在某些情況下會包含 LaTeX 錯誤。 GenAI LaTeX Proofreader 將嘗試修復這些問題。但在某些情況下，校對報告可能無法編譯。

入門

請注意，這項工作是概念的早期證明，因此可能需要熟悉開發工具（git、Python、Docker、Anthropic API 存取）才能使其正常運作。

以下步驟（適用於基於 Mac/Linux 的系統）說明如何校對論文：

第 1 步：克隆儲存庫

git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader

步驟 2：建置 Docker 容器（使用 Python 和 Latex）

(cd .devcontainer/latex ; make build)

步驟 3：為 Anthropic API 設定秘密令牌，請參閱 https://docs.anthropic.com/en/docs/quickstart

 export ANTHROPIC_API_KEY= ' your-secret-api-key-here '

（注意：不要共享您的ANTHROPIC_API_KEY ）

步驟 4：將建構論文所需的檔案複製到儲存庫中的「paper-to-proofread」子目錄中。

mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread

為了進行測試，您可以使用儲存庫中提供的虛擬紙張tests/integration/assets/empty_paper.tex 。

mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/

（注意：請始終備份您的論文。）

第 5 步：運行genai-latex-proofreader

(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)

對於中等尺寸的紙張，這將需要幾分鐘的時間。如果一切正常，校對報告可以在output/report.pdf中找到。

配置和自訂

根據論文的主題，您可能需要調整定義校對角色的提示。目前提示需要直接在Python原始碼中編輯。

生成式人工智慧

GenAI LaTeX Proofreader使用 GenAI（生成式 AI）和大語言模型 (LLM) 來自動校對科學論文。截至2024年，GenAI是一項快速發展的技術，發展迅速。

以下的清單包含一些關於該主題的參考文獻和相關著作，以及更廣泛地關於使用人工智慧進行科學發現的參考文獻和相關著作：

12/2023，微軟研究院，大型語言模型對科學發現的影響：使用 GPT-4 的初步研究
- https://arxiv.org/pdf/2311.07361
10/2023，W. Liang 等人，大型語言模型能否為研究論文提供有用的回饋？大規模實證分析
- https://arxiv.org/abs/2310.01783
- https://github.com/Weixin-Liang/LLM-scientific-feedback
6/2023，人工智慧輔助數學推理：美國國家科學院組織的研討會。
- https://www.nationalacademies.org/event/06-12-2023/ai-to-assist-mathematical-reasoning-a-workshop
- 作為研討會的一部分收集的資源集合：https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit