GenAI LaTeX Proofreader adalah alat otomatis yang menggunakan AI generatif untuk mengoreksi dan menyarankan perbaikan pada makalah ilmiah yang ditulis dalam LaTeX. Saran-saran tersebut ditambahkan ke dalam file sumber LaTeX asli untuk membuat laporan proofreading. Alat ini terutama ditujukan bagi penulis yang mengerjakan makalah ilmiah.
Secara lebih rinci, laporan proofreading yang dihasilkan berisi makalah asli yang sedang ditinjau, dengan daftar saran dilampirkan di awal setiap bagian. Untuk setiap bagian, umpan balik dibuat dari perspektif persona proofreading yang berbeda. Misalnya, saat menulis makalah, ini bisa berupa "Pakar Domain", "Pakar Bahasa Inggris", dan "Editor Buku". Namun, persona juga dapat mencakup persona tambahan seperti "Peninjau statistik", "spesialis LaTeX" atau "Pakar bahasa inklusif" dll, bergantung pada topik makalah.
Di sini "proofreading" harus diartikan secara luas. Meskipun model bahasa besar (LLM) saat ini memiliki pemahaman tentang logika, matematika, dan fisika, LLM tidak boleh dipercaya untuk mengoreksi hasil ilmiah secara serius. Oleh karena itu, setiap saran harus dievaluasi secara kritis. Di sisi lain, bagi penulis yang akrab dengan suatu topik, laporan yang dihasilkan dapat digunakan untuk mengukur seberapa dalam LLM dapat bernalar tentang makalah yang sedang ditinjau.
Proofreader LaTeX GenAI memerlukan langganan API Antropik.
Untuk pengembangan dan pengujian, GenAI LaTeX Proofreader dievaluasi secara rutin dengan mengoreksi dua kertas pengujian:
Secara lebih rinci, makalah ini mengoreksi semua proses CI yang dipicu secara manual di repo ini. Dengan demikian, Anda dapat memeriksa laporan pemeriksaan yang dihasilkan ( report.pdf
) dari pipeline CI terbaru yang dijalankan di Github:
Pengoreksian dokumen LaTeX yang sepenuhnya otomatis.
Selain hal di atas, seseorang dapat menambahkan persona proofreading lainnya. Namun, saat ini seseorang harus mengedit kode sumber Python.
Ide menggunakan persona AI yang berbeda untuk proofreading terinspirasi oleh buku Co-Intelligence: Living and working with AI karya Ethan Mollick yang diterbitkan pada 4/2024.
section{..}
pertama tidak akan dikoreksi.section*{..}
.Perhatikan bahwa karya ini merupakan bukti awal konsep, jadi pemahaman tentang alat pengembangan (git, Python, Docker, akses Anthropic API) mungkin diperlukan agar ini berfungsi.
Langkah-langkah di bawah ini (untuk sistem berbasis Mac/Linux) menjelaskan cara mengoreksi makalah:
Langkah 1: Kloning repo
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
Langkah 2: Bangun container Docker (dengan Python dan Latex)
(cd .devcontainer/latex ; make build)
Langkah 3: Siapkan token rahasia ke Anthropic API, lihat https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(Catatan: jangan bagikan ANTHROPIC_API_KEY
Anda)
Langkah 4: Salin file yang diperlukan untuk membuat makalah Anda ke subdirektori 'paper-to-proofread' di repo.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
Untuk pengujian Anda dapat menggunakan kertas tiruan tests/integration/assets/empty_paper.tex
yang disediakan di repo.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(Catatan: Harap selalu memiliki cadangan kertas Anda.)
Langkah 5: Jalankan genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
Untuk kertas berukuran sedang, proses ini memerlukan waktu beberapa menit. Jika semuanya berfungsi, laporan proofreading dapat ditemukan di output/report.pdf
.
Tergantung pada topik makalah Anda, Anda mungkin ingin menyesuaikan petunjuk yang menentukan persona proofreading. Saat ini petunjuknya perlu diedit langsung di kode sumber Python.
GenAI LaTeX Proofreader menggunakan GenAI (Generative AI) dan model bahasa besar (LLM) untuk mengotomatiskan pengoreksian makalah ilmiah. Pada tahun 2024, GenAI merupakan teknologi yang berkembang pesat dengan perkembangan yang pesat.
Daftar di bawah ini berisi beberapa referensi dan karya terkait tentang topik ini, dan lebih luas lagi tentang penggunaan AI untuk membuat penemuan ilmiah:
12/2023, Microsoft Research, Dampak Model Bahasa Besar terhadap Penemuan Ilmiah: Studi Pendahuluan menggunakan GPT-4
10/2023, W. Liang et al., Dapatkah model bahasa besar memberikan umpan balik yang berguna pada makalah penelitian? Analisis empiris skala besar
6/2023, AI untuk Membantu Penalaran Matematika: Lokakarya yang diselenggarakan oleh National Academies of Sciences.
Kontribusi, umpan balik, atau ide dipersilakan!
Jangan ragu untuk menghubungi saya atau menyampaikan masalah di repo ini.
(Pertanyaan ini berada di luar bidang keahlian saya.)
Pedoman dan praktik seputar penggunaan konten AI masih terus berkembang. Namun, untuk menerbitkan karya dalam lingkungan akademis, harap rujuk terlebih dahulu ke penasihat, departemen, jurnal, dan/atau universitas Anda.
Harap perhatikan juga bahwa:
"GenAI LaTeX Proofreader" adalah hak cipta 2024 Matias Dahl (dan kontributor), dan didistribusikan di bawah ketentuan lisensi sumber terbuka MIT.
Sebagian dari pekerjaan ini telah dikembangkan menggunakan alat yang didukung AI.
Untuk detailnya, silakan lihat file LISENSI.