GenAI LaTeX 교정기는 생성 AI를 사용하여 LaTeX로 작성된 과학 논문을 교정하고 개선 사항을 제안하는 자동화된 도구입니다. 제안 사항은 교정 보고서를 생성하는 원본 LaTeX 소스 파일에 추가됩니다. 이 도구는 주로 과학 논문을 작업하는 저자를 위한 것입니다.
더 자세히 말하면, 생성된 교정 보고서에는 검토 중인 원본 논문이 포함되어 있으며 각 섹션의 시작 부분에 제안 목록이 첨부되어 있습니다. 각 섹션에 대해 다양한 교정자 페르소나의 관점에서 피드백이 생성됩니다. 예를 들어 논문을 작성할 때 '도메인 전문가', '영어 전문가', '도서 편집자' 등이 될 수 있습니다. 그러나 페르소나에는 논문 주제에 따라 "통계 검토자", "LaTeX 전문가" 또는 "포괄적 언어 전문가" 등과 같은 추가 페르소나가 포함될 수도 있습니다.
여기서 '교정'은 폭넓게 해석되어야 합니다. 현재 LLM(대형 언어 모델)은 논리, 수학 및 물리학을 이해하고 있지만 LLM은 과학적 결과의 심각한 교정을 신뢰해서는 안 됩니다. 따라서 모든 제안은 비판적으로 평가되어야 합니다. 반면, 특정 주제에 익숙한 저자의 경우 생성된 보고서를 사용하여 LLM이 검토 중인 논문에 대해 얼마나 깊이 추론할 수 있는지 측정할 수 있습니다.
GenAI LaTeX 교정기는 Anthropic API 구독이 필요합니다.
개발 및 테스트를 위해 GenAI LaTeX Proofreader는 두 가지 테스트 논문을 교정하여 정기적으로 평가됩니다.
더 자세히 말하자면, 이 문서는 이 저장소에서 수동으로 트리거된 모든 CI 실행에 대해 교정되었습니다. 따라서 Github에서 최근 CI 파이프라인 실행을 통해 생성된 교정 보고서( report.pdf
)를 검사할 수 있습니다.
LaTeX 문서의 완전 자동 교정.
위의 것 외에도 다른 교정 페르소나를 추가할 수 있습니다. 그러나 현재 이를 위해서는 Python 소스 코드를 편집해야 합니다.
교정을 위해 다양한 AI 페르소나를 사용한다는 아이디어는 2024년 4월에 출판된 Ethan Mollick의 저서 Co-Intelligence: Living and Working with AI에서 영감을 받았습니다.
section{..}
앞의 내용은 교정되지 않습니다.section*{..}
지원되지 않습니다.이 작업은 초기 개념 증명이므로 이 작업을 수행하려면 개발 도구(git, Python, Docker, Anthropic API 액세스)에 대한 지식이 필요할 수 있습니다.
아래 단계(Mac/Linux 기반 시스템의 경우)에서는 논문 교정 방법을 설명합니다.
1단계: 저장소 복제
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
2단계: Docker 컨테이너 구축(Python 및 Latex 사용)
(cd .devcontainer/latex ; make build)
3단계: Anthropic API에 비밀 토큰을 설정합니다. https://docs.anthropic.com/en/docs/quickstart를 참조하세요.
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(참고: ANTHROPIC_API_KEY
를 공유하지 마세요)
4단계: 보고서를 작성하는 데 필요한 파일을 저장소의 'paper-to-proofread' 하위 디렉터리에 복사합니다.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
테스트를 위해 저장소에 제공되는 더미 종이 tests/integration/assets/empty_paper.tex
사용할 수 있습니다.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(참고: 항상 문서를 백업해 두십시오.)
5단계: genai-latex-proofreader
실행
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
중간 크기 용지의 경우 몇 분 정도 걸립니다. 모든 것이 제대로 작동했다면, 교정 보고서는 output/report.pdf
에서 찾을 수 있습니다.
논문 주제에 따라 교정 페르소나를 정의하는 프롬프트를 조정하고 싶을 수도 있습니다. 현재 프롬프트는 Python 소스 코드에서 직접 편집해야 합니다.
GenAI LaTeX 교정기는 GenAI(Generative AI)와 대규모 언어 모델(LLM)을 사용하여 과학 논문 교정을 자동화합니다. 2024년 현재 GenAI는 빠른 발전으로 빠르게 발전하는 기술입니다.
아래 목록에는 이 주제에 대한 일부 참고 자료와 관련 작품이 포함되어 있으며, 더 광범위하게는 AI를 사용하여 과학적 발견을 하는 방법에 대해 설명합니다.
2023년 12월, Microsoft Research, 과학적 발견에 대한 대규모 언어 모델의 영향: GPT-4를 사용한 예비 연구
2023년 10월, W. Liang et al., 대규모 언어 모델이 연구 논문에 유용한 피드백을 제공할 수 있습니까? 대규모 실증적 분석
2023년 6월, 수학적 추론을 지원하는 AI: 국립과학원(National Academies of Sciences)이 주최한 워크숍 .
기여, 피드백 또는 아이디어를 환영합니다!
언제든지 저에게 연락하시거나 이 저장소에 문제를 제기해 주세요.
(이 질문은 제 전문분야가 아닙니다.)
AI 콘텐츠 사용에 관한 지침과 관행은 여전히 진화하고 있습니다. 그러나 학문적 환경에서 출판할 작업의 경우 먼저 지도교수, 학과, 저널 및/또는 대학에 문의하시기 바랍니다.
다음 사항도 참고하세요.
"GenAI LaTeX Proofreader"는 저작권 2024 Matias Dahl(및 기여자)이며 MIT 오픈 소스 라이선스 조건에 따라 배포됩니다.
이 작업의 일부는 AI 기반 도구를 사용하여 개발되었습니다.
자세한 내용은 LICENSE 파일을 참조하세요.