GenAI LaTeX Proofreader は、生成 AI を使用して LaTeX で書かれた科学論文を校正し、改善を提案する自動ツールです。提案は元の LaTeX ソース ファイルに追加され、校正レポートが作成されます。このツールは主に科学論文の執筆者を対象としています。
さらに詳しく説明すると、生成された校正レポートにはレビュー中の元の論文が含まれており、各セクションの先頭に提案のリストが添付されています。セクションごとに、さまざまな校正担当者の観点からフィードバックが作成されます。たとえば、論文を書く場合、「分野の専門家」、「英語の専門家」、「書籍の編集者」などが考えられます。ただし、論文のテーマに応じて、ペルソナには、「統計評論家」、「LaTeX 専門家」、「包括的言語専門家」などの追加のペルソナが含まれる場合もあります。
ここでの「校正」は広く解釈されるべきです。現在の大規模言語モデル (LLM) は論理、数学、物理学を理解していますが、科学的結果の本格的な校正には LLM を信頼すべきではありません。したがって、いかなる提案も批判的に評価する必要があります。一方、あるトピックに詳しい著者の場合、生成されたレポートを使用して、LLM が査読中の論文についてどの程度深く推論できるかを評価できます。
GenAI LaTeX Proofreader を使用するには、Anthropic API へのサブスクリプションが必要です。
開発とテストのために、GenAI LaTeX Proofreader は 2 つのテスト用紙を校正することによって定期的に評価されます。
さらに詳しく言うと、これらの文書は、このリポジトリ内で手動でトリガーされたすべての CI 実行に対して校正されています。したがって、Github で最近実行された CI パイプラインから生成された校正レポート ( report.pdf
) を検査できます。
LaTeX 文書の完全自動校正。
上記に加えて、他の校正ペルソナを追加することもできます。ただし、現時点では Python ソース コードを編集する必要があります。
校正にさまざまな AI ペルソナを使用するというアイデアは、2024 年 4 月に出版されたイーサン モリックの著書『Co-Intelligence: Living and working with AI』からインスピレーションを得ています。
section{..}
より前のコンテンツは校正されません。section*{..}
。この作業は初期の概念実証であるため、これを機能させるには開発ツール (git、Python、Docker、Anthropic API アクセス) にある程度の精通が必要な場合があることに注意してください。
以下の手順 (Mac/Linux ベースのシステムの場合) では、論文を校正する方法について説明します。
ステップ 1: リポジトリのクローンを作成する
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
ステップ 2: Docker コンテナを構築する (Python と Latex を使用)
(cd .devcontainer/latex ; make build)
ステップ 3: Anthropic API へのシークレット トークンを設定します。https://docs.anthropic.com/en/docs/quickstart を参照してください。
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(注: ANTHROPIC_API_KEY
を共有しないでください)
ステップ 4: 論文の作成に必要なファイルをリポジトリ内の「paper-to-proofread」サブディレクトリにコピーします。
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
テストには、リポジトリで提供されているダミーのペーパーtests/integration/assets/empty_paper.tex
を使用できます。
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(注意: 論文は必ずバックアップを取ってください。)
ステップ 5: genai-latex-proofreader
を実行する
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
中サイズの用紙の場合、これには数分かかります。すべてがうまくいった場合、校正レポートはoutput/report.pdf
にあります。
論文のテーマに応じて、校正ペルソナを定義するプロンプトを調整する必要がある場合があります。現在、プロンプトは Python ソース コードで直接編集する必要があります。
GenAI LaTeX Proofreader は、 GenAI (Generative AI) とラージ言語モデル (LLM) を使用して科学論文の校正を自動化します。 2024 年の時点で、GenAI は急速に発展し、急速に進化しているテクノロジーです。
以下のリストには、このトピックに関するいくつかの参考文献と関連著作、および科学的発見を行うための AI の使用に関するより広範な資料が含まれています。
2023 年 12 月、Microsoft Research、科学的発見に対する大規模言語モデルの影響: GPT-4 を使用した予備調査
10/2023、W. Liang 他、大規模言語モデルは研究論文に有用なフィードバックを提供できますか?大規模な実証分析
2023 年 6 月、数学的推論を支援する AI: 米国科学アカデミーが主催するワークショップ。
貢献、フィードバック、アイデアは大歓迎です。
お気軽にご連絡いただくか、このリポジトリで問題を提起してください。
(この質問は私の専門分野外です。)
AI コンテンツの使用に関するガイドラインと実践は依然として進化しています。ただし、学術的な環境で作品を出版する場合は、まず指導教員、学部、雑誌、大学に問い合わせてください。
次の点にも注意してください。
「GenAI LaTeX Proofreader」の著作権は 2024 Matias Dahl (および寄稿者) にあり、MIT オープンソース ライセンスの条件に基づいて配布されています。
この作業の一部は、AI を活用したツールを使用して開発されました。
詳細については、LICENSE ファイルを参照してください。