GenAI LaTeX Proofreader เป็นเครื่องมืออัตโนมัติที่ใช้ generative AI เพื่อพิสูจน์อักษรและเสนอแนะการปรับปรุงเอกสารทางวิทยาศาสตร์ที่เขียนด้วย LaTeX คำแนะนำจะถูกผนวกเข้ากับไฟล์ต้นฉบับ LaTeX เพื่อสร้างรายงานการพิสูจน์อักษร เครื่องมือนี้มีไว้สำหรับผู้เขียนที่ทำงานในบทความทางวิทยาศาสตร์เป็นหลัก
ในรายละเอียดเพิ่มเติม รายงานการพิสูจน์อักษรที่สร้างขึ้นประกอบด้วยบทความต้นฉบับที่อยู่ระหว่างการพิจารณา โดยมีรายการข้อเสนอแนะแนบอยู่ที่ตอนต้นของแต่ละส่วน สำหรับแต่ละส่วน ความคิดเห็นจะถูกสร้างขึ้นจากมุมมองของบุคคลในการพิสูจน์อักษรที่แตกต่างกัน ตัวอย่างเช่น เมื่อเขียนรายงาน อาจเป็น "ผู้เชี่ยวชาญโดเมน" "ผู้เชี่ยวชาญภาษาอังกฤษ" และ "บรรณาธิการหนังสือ" อย่างไรก็ตาม บุคคลดังกล่าวอาจรวมถึงบุคคลเพิ่มเติม เช่น "ผู้ตรวจสอบทางสถิติ" "ผู้เชี่ยวชาญ LaTeX" หรือ "ผู้เชี่ยวชาญด้านภาษาแบบครอบคลุม" ฯลฯ ขึ้นอยู่กับหัวข้อของรายงาน
ในที่นี้ "การพิสูจน์อักษร" ควรตีความอย่างกว้างๆ แม้ว่าแบบจำลองภาษาขนาดใหญ่ (LLM) ในปัจจุบันจะมีความเข้าใจในตรรกะ คณิตศาสตร์ และฟิสิกส์ แต่ LLM ไม่ควรเชื่อถือได้ในการพิสูจน์อักษรผลลัพธ์ทางวิทยาศาสตร์อย่างจริงจัง ดังนั้นข้อเสนอแนะใด ๆ ควรได้รับการประเมินอย่างมีวิจารณญาณ ในทางกลับกัน สำหรับผู้เขียนที่คุ้นเคยกับหัวข้อ รายงานที่สร้างขึ้นสามารถใช้เพื่อวัดว่า LLM สามารถให้เหตุผลเกี่ยวกับบทความที่อยู่ระหว่างการพิจารณาได้ลึกซึ้งเพียงใด
GenAI LaTeX Proofreader ต้องการการสมัครสมาชิก Anthropic API
สำหรับการพัฒนาและการทดสอบ GenAI LaTeX Proofreader ได้รับการประเมินอย่างสม่ำเสมอโดยการพิสูจน์อักษรเอกสารทดสอบสองฉบับ:
ในรายละเอียดเพิ่มเติม เอกสารเหล่านี้ได้รับการพิสูจน์อักษรสำหรับการเรียกใช้ CI ที่ทริกเกอร์ด้วยตนเองทั้งหมดใน repo นี้ ดังนั้นคุณสามารถตรวจสอบรายงานการพิสูจน์อักษรที่สร้างขึ้น ( report.pdf
) จากไปป์ไลน์ CI ล่าสุดที่ทำงานบน Github:
การพิสูจน์อักษรเอกสาร LaTeX โดยอัตโนมัติโดยสมบูรณ์
นอกเหนือจากที่กล่าวมาข้างต้น เราสามารถเพิ่มบุคคลในการพิสูจน์อักษรอื่นๆ ได้ อย่างไรก็ตาม ในปัจจุบันจำเป็นต้องมีการแก้ไขซอร์สโค้ด Python
แนวคิดในการใช้บุคลิกของ AI ที่แตกต่างกันในการพิสูจน์อักษรได้รับแรงบันดาลใจจากหนังสือ Co-Intelligence: Living and work with AI ของ Ethan Mollick ซึ่งตีพิมพ์เมื่อวันที่ 4/2024
section{..}
แรกจะไม่ได้รับการพิสูจน์อักษรsection*{..}
โปรดทราบว่างานนี้เป็นการพิสูจน์แนวคิดตั้งแต่เนิ่นๆ ดังนั้นอาจจำเป็นต้องมีความคุ้นเคยกับเครื่องมือการพัฒนา (git, Python, Docker, การเข้าถึง Anthropic API) เพื่อให้งานนี้ทำงานได้
ขั้นตอนด้านล่าง (สำหรับระบบที่ใช้ Mac/Linux) อธิบายวิธีการตรวจทานเอกสาร:
ขั้นตอนที่ 1: โคลน repo
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
ขั้นตอนที่ 2: สร้างคอนเทนเนอร์ Docker (ด้วย Python และ Latex)
(cd .devcontainer/latex ; make build)
ขั้นตอนที่ 3: ตั้งค่าโทเค็นลับให้กับ Anthropic API ดู https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(หมายเหตุ: อย่าแชร์ ANTHROPIC_API_KEY
ของคุณ)
ขั้นตอนที่ 4: คัดลอกไฟล์ที่จำเป็นในการสร้างรายงานของคุณลงในไดเรกทอรีย่อย 'paper-to-proofread' ใน repo
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
สำหรับการทดสอบ คุณสามารถใช้กระดาษจำลอง tests/integration/assets/empty_paper.tex
ที่ให้ไว้ใน repo
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(หมายเหตุ: โปรดเตรียมกระดาษสำรองไว้เสมอ)
ขั้นตอนที่ 5: เรียกใช้ genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
สำหรับกระดาษขนาดกลาง จะใช้เวลาสักครู่ หากทุกอย่างได้ผล รายงานการพิสูจน์อักษรจะอยู่ใน output/report.pdf
ขึ้นอยู่กับหัวข้อของรายงานของคุณ คุณอาจต้องการปรับพร้อมท์ที่กำหนดลักษณะการพิสูจน์อักษร ขณะนี้จำเป็นต้องแก้ไขพรอมต์โดยตรงในซอร์สโค้ด Python
GenAI LaTeX Proofreader ใช้ GenAI (Generative AI) และโมเดลภาษาขนาดใหญ่ (LLM) เพื่อทำการพิสูจน์อักษรเอกสารทางวิทยาศาสตร์โดยอัตโนมัติ ในปี 2024 GenAI เป็นเทคโนโลยีที่พัฒนาอย่างรวดเร็วและมีการพัฒนาอย่างรวดเร็ว
รายการด้านล่างประกอบด้วยข้อมูลอ้างอิงและงานที่เกี่ยวข้องเกี่ยวกับหัวข้อนี้ และเนื้อหากว้างๆ เกี่ยวกับการใช้ AI เพื่อการค้นพบทางวิทยาศาสตร์:
12/2023, Microsoft Research, ผลกระทบของแบบจำลองภาษาขนาดใหญ่ต่อการค้นพบทางวิทยาศาสตร์: การศึกษาเบื้องต้นโดยใช้ GPT-4
10/2023, W. Liang และคณะ แบบจำลองภาษาขนาดใหญ่สามารถให้ผลตอบรับที่เป็นประโยชน์เกี่ยวกับงานวิจัยได้หรือไม่? การวิเคราะห์เชิงประจักษ์ขนาดใหญ่
6/2023 AI to Assist Mathematical Reasoning: เวิร์คช็อป ที่จัดโดย National Academies of Sciences
ยินดีต้อนรับการมีส่วนร่วมข้อเสนอแนะหรือความคิด!
อย่าลังเลที่จะติดต่อฉันหรือแจ้งปัญหาใน repo นี้
(คำถามนี้อยู่นอกขอบเขตความเชี่ยวชาญของฉัน)
แนวปฏิบัติและแนวปฏิบัติเกี่ยวกับการใช้เนื้อหา AI ยังคงมีการพัฒนา อย่างไรก็ตาม สำหรับการตีพิมพ์ผลงานในด้านวิชาการ โปรดติดต่อที่ปรึกษา แผนก วารสาร และ/หรือมหาวิทยาลัยของคุณก่อน
โปรดทราบว่า:
"GenAI LaTeX Proofreader" เป็นลิขสิทธิ์ 2024 Matias Dahl (และผู้มีส่วนร่วม) และเผยแพร่ภายใต้เงื่อนไขของใบอนุญาตโอเพ่นซอร์สของ MIT
บางส่วนของงานนี้ได้รับการพัฒนาโดยใช้เครื่องมือที่ขับเคลื่อนด้วย AI
สำหรับรายละเอียด โปรดดูไฟล์ LICENSE