genai latex proofreader 다운로드 - genai latex proofreader 소스 코드 다운로드

genai latex proofreader

AI 소스 코드

1.0.0

다운로드

GenAI LaTeX 교정기

GenAI LaTeX 교정기는 생성 AI를 사용하여 LaTeX로 작성된 과학 논문을 교정하고 개선 사항을 제안하는 자동화된 도구입니다. 제안 사항은 교정 보고서를 생성하는 원본 LaTeX 소스 파일에 추가됩니다. 이 도구는 주로 과학 논문을 작업하는 저자를 위한 것입니다.

더 자세히 말하면, 생성된 교정 보고서에는 검토 중인 원본 논문이 포함되어 있으며 각 섹션의 시작 부분에 제안 목록이 첨부되어 있습니다. 각 섹션에 대해 다양한 교정자 페르소나의 관점에서 피드백이 생성됩니다. 예를 들어 논문을 작성할 때 '도메인 전문가', '영어 전문가', '도서 편집자' 등이 될 수 있습니다. 그러나 페르소나에는 논문 주제에 따라 "통계 검토자", "LaTeX 전문가" 또는 "포괄적 언어 전문가" 등과 같은 추가 페르소나가 포함될 수도 있습니다.

여기서 '교정'은 폭넓게 해석되어야 합니다. 현재 LLM(대형 언어 모델)은 논리, 수학 및 물리학을 이해하고 있지만 LLM은 과학적 결과의 심각한 교정을 신뢰해서는 안 됩니다. 따라서 모든 제안은 비판적으로 평가되어야 합니다. 반면, 특정 주제에 익숙한 저자의 경우 생성된 보고서를 사용하여 LLM이 검토 중인 논문에 대해 얼마나 깊이 추론할 수 있는지 측정할 수 있습니다.

GenAI LaTeX 교정기는 Anthropic API 구독이 필요합니다.

교정 보고서 예시

개발 및 테스트를 위해 GenAI LaTeX Proofreader는 두 가지 테스트 논문을 교정하여 정기적으로 평가됩니다.

빈 종이: 내용이 없는 종이.
arxiv:1108.4207: 내 이전 논문 중 하나의 사전 인쇄본입니다.

더 자세히 말하자면, 이 문서는 이 저장소에서 수동으로 트리거된 모든 CI 실행에 대해 교정되었습니다. 따라서 Github에서 최근 CI 파이프라인 실행을 통해 생성된 교정 보고서( report.pdf )를 검사할 수 있습니다.

CI 실행 예시 2024.06.30
생성된 보고서로 모든 실행
참고: 생성된 보고서를 다운로드하려면 Github에 로그인해야 합니다.

특징

LaTeX 문서의 완전 자동 교정.

교정 보고서를 생성하려면 GenAI API를 호출하고 자동으로 교정 보고서를 생성하는 Python 스크립트를 실행하기만 하면 됩니다. 주석은 입력 LaTeX 파일에 자동으로 삽입되어 PDF로 컴파일됩니다.
예를 들어 논문이 GitHub에서 버전 관리되는 경우 GitHub 실행기를 사용하여 논문의 새 버전이 체크인될 때마다 자동으로 교정 보고서를 생성할 수 있습니다.

지원되는 교정 페르소나

✅ 도메인 전문가(구현)

정확성과 명확성을 위해 각 섹션을 비판적으로 평가합니다. 강점과 약점을 파악하고 향후 작업에 대한 제안을 제공합니다.
또한 제목, 초록 및 소개가 논문의 나머지 내용과 얼마나 잘 일치하는지 평가합니다.
여기에 프롬프트를 구현합니다.

✅ 언어 전문가 (구현됨)

내용의 오타, 표현, 문법 및 흐름을 교정합니다.
여기에 프롬프트를 구현합니다.

? 도서 편집기(아직 구현되지 않음)

논문의 상위 수준 구성을 평가합니다.

? LaTeX 전문가(아직 구현되지 않음)

LaTeX 사용에 대한 피드백을 보내주세요.

? 저널에 대한 동료 검토(아직 구현되지 않음)

아래 참고자료에서 https://arxiv.org/abs/2310.01783을 참조하세요.

? 맞춤형 교정 페르소나

위의 것 외에도 다른 교정 페르소나를 추가할 수 있습니다. 그러나 현재 이를 위해서는 Python 소스 코드를 편집해야 합니다.

교정을 위해 다양한 AI 페르소나를 사용한다는 아이디어는 2024년 4월에 출판된 Ethan Mollick의 저서 Co-Intelligence: Living and Working with AI에서 영감을 받았습니다.

제한사항

논문의 일부 구조가 가정됩니다. 예:
- 첫 번째 section{..} 앞의 내용은 교정되지 않습니다.
- 번호가 없는 섹션은 section*{..} 지원되지 않습니다.
- 포함된 파일의 내용은 교정자에게 표시되지 않습니다.
GenAI는 이미지나 참조를 보거나 이해하지 않습니다.
교정 보고서는 결정적이지 않습니다. 동일한 입력 문서를 사용하여 실행하면 서로 다른 보고서가 생성될 수 있습니다.
OpenAI, Anthropic, Google과 같이 LLM에 대한 액세스를 제공하는 여러 제공업체가 있습니다. 현재는 Anthropic만 지원됩니다.
귀하의 논문은 인터넷을 통해 LLM 제공업체로 전송됩니다. 해당 서비스 약관을 주의 깊게 읽어보시기 바랍니다.
LLM을 사용하면 약간의 비용이 발생합니다.
pdflatex와 TexLive를 사용합니다. TexLive는 arxiv, link에서도 사용됩니다.
제공된 LLM에서 반환된 교정 의견에는 경우에 따라 LaTeX 오류가 포함됩니다. GenAI LaTeX 교정기는 이 문제를 해결하려고 시도합니다. 그러나 경우에 따라 교정 보고서가 컴파일되지 않을 수 있습니다.

시작하기

이 작업은 초기 개념 증명이므로 이 작업을 수행하려면 개발 도구(git, Python, Docker, Anthropic API 액세스)에 대한 지식이 필요할 수 있습니다.

아래 단계(Mac/Linux 기반 시스템의 경우)에서는 논문 교정 방법을 설명합니다.

1단계: 저장소 복제

git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader

2단계: Docker 컨테이너 구축(Python 및 Latex 사용)

(cd .devcontainer/latex ; make build)

3단계: Anthropic API에 비밀 토큰을 설정합니다. https://docs.anthropic.com/en/docs/quickstart를 참조하세요.

 export ANTHROPIC_API_KEY= ' your-secret-api-key-here '

(참고: ANTHROPIC_API_KEY 를 공유하지 마세요)

4단계: 보고서를 작성하는 데 필요한 파일을 저장소의 'paper-to-proofread' 하위 디렉터리에 복사합니다.

mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread

테스트를 위해 저장소에 제공되는 더미 종이 tests/integration/assets/empty_paper.tex 사용할 수 있습니다.

mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/

(참고: 항상 문서를 백업해 두십시오.)

5단계: genai-latex-proofreader 실행

(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)

중간 크기 용지의 경우 몇 분 정도 걸립니다. 모든 것이 제대로 작동했다면, 교정 보고서는 output/report.pdf 에서 찾을 수 있습니다.

구성 및 사용자 정의

논문 주제에 따라 교정 페르소나를 정의하는 프롬프트를 조정하고 싶을 수도 있습니다. 현재 프롬프트는 Python 소스 코드에서 직접 편집해야 합니다.

생성 AI

GenAI LaTeX 교정기는 GenAI(Generative AI)와 대규모 언어 모델(LLM)을 사용하여 과학 논문 교정을 자동화합니다. 2024년 현재 GenAI는 빠른 발전으로 빠르게 발전하는 기술입니다.

아래 목록에는 이 주제에 대한 일부 참고 자료와 관련 작품이 포함되어 있으며, 더 광범위하게는 AI를 사용하여 과학적 발견을 하는 방법에 대해 설명합니다.

2023년 12월, Microsoft Research, 과학적 발견에 대한 대규모 언어 모델의 영향: GPT-4를 사용한 예비 연구
- https://arxiv.org/pdf/2311.07361
2023년 10월, W. Liang et al., 대규모 언어 모델이 연구 논문에 유용한 피드백을 제공할 수 있습니까? 대규모 실증적 분석
- https://arxiv.org/abs/2310.01783
- https://github.com/Weixin-Liang/LLM-scientific-feedback
2023년 6월, 수학적 추론을 지원하는 AI: 국립과학원(National Academies of Sciences)이 주최한 워크숍 .
- https://www.nationalacademies.org/event/06-12-2023/ai-to-assist-mathematical-reasoning-a-workshop
- 워크숍의 일부로 수집된 리소스 컬렉션: https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit

기여

기여, 피드백 또는 아이디어를 환영합니다!

언제든지 저에게 연락하시거나 이 저장소에 문제를 제기해 주세요.

FAQ

이 저작물을 논문에 사용하려면 인용해야 합니까?

(이 질문은 제 전문분야가 아닙니다.)

AI 콘텐츠 사용에 관한 지침과 관행은 여전히 진화하고 있습니다. 그러나 학문적 환경에서 출판할 작업의 경우 먼저 지도교수, 학과, 저널 및/또는 대학에 문의하시기 바랍니다.

다음 사항도 참고하세요.

AI가 생성한 텍스트는 교육 데이터에서 부분을 그대로 재현할 수 있습니다.
LLM 제공업체는 잠재적으로 사용에 제한을 가할 수도 있습니다.
GenAI LaTeX Proofreader는 MIT 라이선스 조건에 따라 배포됩니다. 자세한 내용은 아래를 참조하세요. 이 라이센스는 이 소프트웨어의 사용 방법에 대해 거의 제한을 두지 않으며 일반적인 사용의 경우 라이센스는 인용이 필요하지 않습니다.