ดาวน์โหลด genai latex proofreader - genai latex proofreader ดาวน์โหลดซอร์สโค้ด

genai latex proofreader

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

เครื่องพิสูจน์อักษร GenAI LaTeX

GenAI LaTeX Proofreader เป็นเครื่องมืออัตโนมัติที่ใช้ generative AI เพื่อพิสูจน์อักษรและเสนอแนะการปรับปรุงเอกสารทางวิทยาศาสตร์ที่เขียนด้วย LaTeX คำแนะนำจะถูกผนวกเข้ากับไฟล์ต้นฉบับ LaTeX เพื่อสร้างรายงานการพิสูจน์อักษร เครื่องมือนี้มีไว้สำหรับผู้เขียนที่ทำงานในบทความทางวิทยาศาสตร์เป็นหลัก

ในรายละเอียดเพิ่มเติม รายงานการพิสูจน์อักษรที่สร้างขึ้นประกอบด้วยบทความต้นฉบับที่อยู่ระหว่างการพิจารณา โดยมีรายการข้อเสนอแนะแนบอยู่ที่ตอนต้นของแต่ละส่วน สำหรับแต่ละส่วน ความคิดเห็นจะถูกสร้างขึ้นจากมุมมองของบุคคลในการพิสูจน์อักษรที่แตกต่างกัน ตัวอย่างเช่น เมื่อเขียนรายงาน อาจเป็น "ผู้เชี่ยวชาญโดเมน" "ผู้เชี่ยวชาญภาษาอังกฤษ" และ "บรรณาธิการหนังสือ" อย่างไรก็ตาม บุคคลดังกล่าวอาจรวมถึงบุคคลเพิ่มเติม เช่น "ผู้ตรวจสอบทางสถิติ" "ผู้เชี่ยวชาญ LaTeX" หรือ "ผู้เชี่ยวชาญด้านภาษาแบบครอบคลุม" ฯลฯ ขึ้นอยู่กับหัวข้อของรายงาน

ในที่นี้ "การพิสูจน์อักษร" ควรตีความอย่างกว้างๆ แม้ว่าแบบจำลองภาษาขนาดใหญ่ (LLM) ในปัจจุบันจะมีความเข้าใจในตรรกะ คณิตศาสตร์ และฟิสิกส์ แต่ LLM ไม่ควรเชื่อถือได้ในการพิสูจน์อักษรผลลัพธ์ทางวิทยาศาสตร์อย่างจริงจัง ดังนั้นข้อเสนอแนะใด ๆ ควรได้รับการประเมินอย่างมีวิจารณญาณ ในทางกลับกัน สำหรับผู้เขียนที่คุ้นเคยกับหัวข้อ รายงานที่สร้างขึ้นสามารถใช้เพื่อวัดว่า LLM สามารถให้เหตุผลเกี่ยวกับบทความที่อยู่ระหว่างการพิจารณาได้ลึกซึ้งเพียงใด

GenAI LaTeX Proofreader ต้องการการสมัครสมาชิก Anthropic API

ตัวอย่างรายงานการพิสูจน์อักษร

สำหรับการพัฒนาและการทดสอบ GenAI LaTeX Proofreader ได้รับการประเมินอย่างสม่ำเสมอโดยการพิสูจน์อักษรเอกสารทดสอบสองฉบับ:

กระดาษเปล่า : กระดาษที่ไม่มีสาร
arxiv:1108.4207: พิมพ์ล่วงหน้าของหนึ่งในเอกสารก่อนหน้าของฉัน

ในรายละเอียดเพิ่มเติม เอกสารเหล่านี้ได้รับการพิสูจน์อักษรสำหรับการเรียกใช้ CI ที่ทริกเกอร์ด้วยตนเองทั้งหมดใน repo นี้ ดังนั้นคุณสามารถตรวจสอบรายงานการพิสูจน์อักษรที่สร้างขึ้น ( report.pdf ) จากไปป์ไลน์ CI ล่าสุดที่ทำงานบน Github:

ตัวอย่าง CI รัน 2024.06.30
ทั้งหมดทำงานด้วยรายงานที่สร้างขึ้น
หมายเหตุ: ในการดาวน์โหลดรายงานที่สร้างขึ้น คุณจะต้องลงชื่อเข้าใช้ Github

คุณสมบัติ

การพิสูจน์อักษรเอกสาร LaTeX โดยอัตโนมัติโดยสมบูรณ์

หากต้องการสร้างรายงานการพิสูจน์อักษร เราจำเป็นต้องเรียกใช้สคริปต์ Python เท่านั้น ซึ่งจะทำการเรียกไปยัง GenAI API และสร้างรายงานการพิสูจน์อักษรโดยอัตโนมัติ ความคิดเห็นจะถูกแทรกลงในไฟล์ LaTeX อินพุตโดยอัตโนมัติและรวบรวมเป็น PDF
เช่น หากเอกสารอยู่ภายใต้การควบคุมเวอร์ชันใน GitHub เราสามารถใช้ GitHub runners เพื่อสร้างรายงานการพิสูจน์อักษรโดยอัตโนมัติทุกครั้งที่มีการเช็คอินเอกสารเวอร์ชันใหม่

รองรับการพิสูจน์อักษรบุคคล

✅ ผู้เชี่ยวชาญด้านโดเมน (นำไปใช้แล้ว)

ประเมินแต่ละส่วนอย่างมีวิจารณญาณเพื่อความถูกต้องและชัดเจน ระบุจุดแข็ง จุดอ่อน และให้คำแนะนำในการทำงานในอนาคต
ประเมินด้วยว่าชื่อเรื่อง บทคัดย่อ และคำนำตรงกับเนื้อหาส่วนที่เหลือของรายงานได้ดีเพียงใด
การดำเนินการพร้อมท์ที่นี่

✅ ผู้เชี่ยวชาญด้านภาษา (ดำเนินการแล้ว)

ตรวจทานเนื้อหาเพื่อหาการพิมพ์ผิด การใช้ถ้อยคำ ไวยากรณ์ และการไหล
การดำเนินการพร้อมท์ที่นี่

- บรรณาธิการหนังสือ (ยังไม่ได้ดำเนินการ)

ประเมินการจัดระเบียบระดับสูงของรายงาน

- ผู้เชี่ยวชาญ LaTeX (ยังไม่ได้ใช้งาน)

แสดงความคิดเห็นเกี่ยวกับการใช้ LaTeX ของคุณ

- การทบทวนวารสารโดยผู้ทรงคุณวุฒิ (ยังไม่ได้ดำเนินการ)

ดูhttps://arxiv.org/abs/2310.01783ในข้อมูลอ้างอิงด้านล่าง

- บุคลิกการพิสูจน์อักษรที่กำหนดเอง

นอกเหนือจากที่กล่าวมาข้างต้น เราสามารถเพิ่มบุคคลในการพิสูจน์อักษรอื่นๆ ได้ อย่างไรก็ตาม ในปัจจุบันจำเป็นต้องมีการแก้ไขซอร์สโค้ด Python

แนวคิดในการใช้บุคลิกของ AI ที่แตกต่างกันในการพิสูจน์อักษรได้รับแรงบันดาลใจจากหนังสือ Co-Intelligence: Living and work with AI ของ Ethan Mollick ซึ่งตีพิมพ์เมื่อวันที่ 4/2024

ข้อจำกัด

มีการใช้โครงสร้างบางอย่างสำหรับกระดาษ เช่น
- เนื้อหาก่อน section{..} แรกจะไม่ได้รับการพิสูจน์อักษร
- ไม่รองรับส่วนที่ไม่มีหมายเลข section*{..}
- เนื้อหาของไฟล์ที่รวมไว้จะไม่ปรากฏให้ผู้ตรวจทานเห็น
GenAI จะไม่เห็นหรือเข้าใจรูปภาพหรือการอ้างอิงใดๆ
รายงานการพิสูจน์อักษรจะไม่ถูกกำหนด การรันที่แตกต่างกันโดยใช้เอกสารอินพุตเดียวกันอาจสร้างรายงานที่แตกต่างกัน
มีผู้ให้บริการหลายรายที่ให้การเข้าถึง LLM เช่น OpenAI, Anthropic, Google ขณะนี้รองรับเฉพาะ Anthropic เท่านั้น
เอกสารของคุณจะถูกส่งทางอินเทอร์เน็ตไปยังผู้ให้บริการ LLM โปรดอ่านข้อกำหนดในการให้บริการอย่างละเอียด
การใช้ LLM จะต้องเสียค่าใช้จ่ายด้วย
ใช้ pdflatex และ TexLive TexLive ยังใช้โดย arxiv ลิงก์
ความคิดเห็นในการพิสูจน์อักษรที่ส่งคืนโดย LLM ที่ให้มาในบางกรณีอาจมีข้อผิดพลาด LaTeX GenAI LaTeX Proofreader จะพยายามแก้ไขปัญหาเหล่านี้ อย่างไรก็ตาม ในบางกรณี รายงานการพิสูจน์อักษรอาจไม่สามารถรวบรวมได้

เริ่มต้นใช้งาน

โปรดทราบว่างานนี้เป็นการพิสูจน์แนวคิดตั้งแต่เนิ่นๆ ดังนั้นอาจจำเป็นต้องมีความคุ้นเคยกับเครื่องมือการพัฒนา (git, Python, Docker, การเข้าถึง Anthropic API) เพื่อให้งานนี้ทำงานได้

ขั้นตอนด้านล่าง (สำหรับระบบที่ใช้ Mac/Linux) อธิบายวิธีการตรวจทานเอกสาร:

ขั้นตอนที่ 1: โคลน repo

git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader

ขั้นตอนที่ 2: สร้างคอนเทนเนอร์ Docker (ด้วย Python และ Latex)

(cd .devcontainer/latex ; make build)

ขั้นตอนที่ 3: ตั้งค่าโทเค็นลับให้กับ Anthropic API ดู https://docs.anthropic.com/en/docs/quickstart

 export ANTHROPIC_API_KEY= ' your-secret-api-key-here '

(หมายเหตุ: อย่าแชร์ ANTHROPIC_API_KEY ของคุณ)

ขั้นตอนที่ 4: คัดลอกไฟล์ที่จำเป็นในการสร้างรายงานของคุณลงในไดเรกทอรีย่อย 'paper-to-proofread' ใน repo

mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread

สำหรับการทดสอบ คุณสามารถใช้กระดาษจำลอง tests/integration/assets/empty_paper.tex ที่ให้ไว้ใน repo

mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/

(หมายเหตุ: โปรดเตรียมกระดาษสำรองไว้เสมอ)

ขั้นตอนที่ 5: เรียกใช้ genai-latex-proofreader

(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)

สำหรับกระดาษขนาดกลาง จะใช้เวลาสักครู่ หากทุกอย่างได้ผล รายงานการพิสูจน์อักษรจะอยู่ใน output/report.pdf

การกำหนดค่าและการปรับแต่ง

ขึ้นอยู่กับหัวข้อของรายงานของคุณ คุณอาจต้องการปรับพร้อมท์ที่กำหนดลักษณะการพิสูจน์อักษร ขณะนี้จำเป็นต้องแก้ไขพรอมต์โดยตรงในซอร์สโค้ด Python

AI กำเนิด

GenAI LaTeX Proofreader ใช้ GenAI (Generative AI) และโมเดลภาษาขนาดใหญ่ (LLM) เพื่อทำการพิสูจน์อักษรเอกสารทางวิทยาศาสตร์โดยอัตโนมัติ ในปี 2024 GenAI เป็นเทคโนโลยีที่พัฒนาอย่างรวดเร็วและมีการพัฒนาอย่างรวดเร็ว

รายการด้านล่างประกอบด้วยข้อมูลอ้างอิงและงานที่เกี่ยวข้องเกี่ยวกับหัวข้อนี้ และเนื้อหากว้างๆ เกี่ยวกับการใช้ AI เพื่อการค้นพบทางวิทยาศาสตร์:

12/2023, Microsoft Research, ผลกระทบของแบบจำลองภาษาขนาดใหญ่ต่อการค้นพบทางวิทยาศาสตร์: การศึกษาเบื้องต้นโดยใช้ GPT-4
- https://arxiv.org/pdf/2311.07361
10/2023, W. Liang และคณะ แบบจำลองภาษาขนาดใหญ่สามารถให้ผลตอบรับที่เป็นประโยชน์เกี่ยวกับงานวิจัยได้หรือไม่? การวิเคราะห์เชิงประจักษ์ขนาดใหญ่
- https://arxiv.org/abs/2310.01783
- https://github.com/Weixin-Liang/LLM-scientific-feedback
6/2023 AI to Assist Mathematical Reasoning: เวิร์คช็อป ที่จัดโดย National Academies of Sciences
- https://www.nationalacademies.org/event/06-12-2023/ai-to-assist-mathematical-reasoning-a-workshop
- การรวบรวมทรัพยากรที่รวบรวมเป็นส่วนหนึ่งของการประชุมเชิงปฏิบัติการ: https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit

ผลงาน

ยินดีต้อนรับการมีส่วนร่วมข้อเสนอแนะหรือความคิด!

อย่าลังเลที่จะติดต่อฉันหรือแจ้งปัญหาใน repo นี้

คำถามที่พบบ่อย

ฉันจำเป็นต้องอ้างอิงงานนี้หรือไม่หากฉันใช้เป็นรายงาน?

(คำถามนี้อยู่นอกขอบเขตความเชี่ยวชาญของฉัน)

แนวปฏิบัติและแนวปฏิบัติเกี่ยวกับการใช้เนื้อหา AI ยังคงมีการพัฒนา อย่างไรก็ตาม สำหรับการตีพิมพ์ผลงานในด้านวิชาการ โปรดติดต่อที่ปรึกษา แผนก วารสาร และ/หรือมหาวิทยาลัยของคุณก่อน

โปรดทราบว่า:

ข้อความที่สร้างโดย AI อาจทำซ้ำส่วนคำต่อคำจากข้อมูลการฝึกอบรม
ผู้ให้บริการ LLM อาจกำหนดข้อจำกัดในการใช้งานด้วย
GenAI LaTeX Proofreader ได้รับการเผยแพร่ภายใต้เงื่อนไขของใบอนุญาต MIT ดูรายละเอียดด้านล่าง ใบอนุญาตนี้มีข้อจำกัดน้อยมากเกี่ยวกับวิธีการใช้ซอฟต์แวร์นี้ และสำหรับการใช้งานปกติ ใบอนุญาตไม่จำเป็นต้องอ้างอิง