GenAI LaTeX Proofreader ist ein automatisiertes Tool, das generative KI nutzt, um in LaTeX verfasste wissenschaftliche Arbeiten Korrektur zu lesen und Verbesserungen vorzuschlagen. Die Vorschläge werden in die ursprüngliche LaTeX-Quelldatei eingefügt, wodurch ein Korrekturlesebericht erstellt wird. Dieses Tool richtet sich in erster Linie an Autoren, die an einer wissenschaftlichen Arbeit arbeiten.
Genauer gesagt enthält der erstellte Korrekturlesebericht die zu prüfende Originalarbeit sowie eine Liste mit Vorschlägen am Anfang jedes Abschnitts. Für jeden Abschnitt wird Feedback aus der Perspektive verschiedener Korrektorpersonen erstellt. Beim Verfassen einer Arbeit könnten dies beispielsweise „Domänenexperte“, „Experte für englische Sprache“ und „Buchredakteur“ sein. Allerdings können die Personas je nach Thema der Arbeit auch weitere Personas wie „Statistischer Gutachter“, „LaTeX-Spezialist“ oder „Inklusiver Sprachexperte“ usw. umfassen.
Dabei ist „Korrekturlesen“ weit zu interpretieren. Während aktuelle Large Language Models (LLMs) über Kenntnisse in Logik, Mathematik und Physik verfügen, sollte man sich LLMs nicht für das ernsthafte Korrekturlesen wissenschaftlicher Ergebnisse anvertrauen. Daher sollten alle Vorschläge kritisch bewertet werden. Andererseits kann der erstellte Bericht für Autoren, die mit einem Thema vertraut sind, dazu verwendet werden, zu beurteilen, wie tiefgreifend ein LLM über die zu begutachtende Arbeit nachdenken kann.
GenAI LaTeX Proofreader erfordert ein Abonnement der Anthropic API.
Zu Entwicklungs- und Testzwecken wird GenAI LaTeX Proofreader regelmäßig durch Korrekturlesen von zwei Testarbeiten evaluiert:
Genauer gesagt werden diese Dokumente für alle manuell ausgelösten CI-Läufe in diesem Repo Korrektur gelesen. So können Sie die generierten Korrekturleseberichte ( report.pdf
) aus den letzten CI-Pipeline-Läufen auf Github einsehen:
Vollständig automatisiertes Korrekturlesen von LaTeX-Dokumenten.
Zusätzlich zu den oben genannten können weitere Korrekturlesepersonen hinzugefügt werden. Allerdings erfordert dies derzeit, dass man den Python-Quellcode bearbeitet.
Die Idee, verschiedene KI-Personas für das Korrekturlesen zu verwenden, ist inspiriert von Ethan Mollicks Buch Co-Intelligence: Living and Working with AI, erschienen 4/2024.
section{..}
werden nicht Korrektur gelesen.section*{..}
.Beachten Sie, dass es sich bei dieser Arbeit um einen frühen Proof of Concept handelt, sodass möglicherweise eine gewisse Vertrautheit mit den Entwicklungstools (Git, Python, Docker, Anthropic API-Zugriff) erforderlich ist, damit dies funktioniert.
Die folgenden Schritte (für Mac-/Linux-basierte Systeme) beschreiben, wie Sie eine Arbeit Korrektur lesen:
Schritt 1: Klonen Sie das Repo
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
Schritt 2: Erstellen Sie den Docker-Container (mit Python und Latex)
(cd .devcontainer/latex ; make build)
Schritt 3: Richten Sie einen geheimen Token für die Anthropic API ein, siehe https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(Hinweis: Geben Sie Ihren ANTHROPIC_API_KEY
nicht weiter.)
Schritt 4: Kopieren Sie die zum Erstellen Ihrer Arbeit erforderlichen Dateien in das Unterverzeichnis „paper-to-proofread“ im Repo.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
Zum Testen können Sie ein im Repository bereitgestelltes Dummy-Papier tests/integration/assets/empty_paper.tex
verwenden.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(Hinweis: Bitte halten Sie immer eine Sicherungskopie Ihrer Arbeit bereit.)
Schritt 5: Führen Sie genai-latex-proofreader
aus
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
Bei mittelgroßem Papier dauert dies einige Minuten. Wenn alles funktioniert hat, finden Sie den Korrekturlesebericht in output/report.pdf
.
Abhängig vom Thema Ihrer Arbeit möchten Sie möglicherweise die Eingabeaufforderungen anpassen, die die Korrekturlese-Personas definieren. Derzeit müssen die Eingabeaufforderungen direkt im Python-Quellcode bearbeitet werden.
GenAI LaTeX Proofreader nutzt GenAI (Generative AI) und große Sprachmodelle (LLM), um das Korrekturlesen wissenschaftlicher Arbeiten zu automatisieren. Ab 2024 ist GenAI eine sich schnell entwickelnde Technologie mit rasanten Entwicklungen.
Die folgende Liste enthält einige Referenzen und verwandte Arbeiten zu diesem Thema und allgemeiner zum Einsatz von KI für wissenschaftliche Entdeckungen:
12/2023, Microsoft Research, The Impact of Large Language Models on Scientific Discovery: a Preliminary Study using GPT-4
10/2023, W. Liang et al., Können große Sprachmodelle nützliches Feedback zu Forschungsarbeiten geben? Eine groß angelegte empirische Analyse
6/2023, KI zur Unterstützung des mathematischen Denkens: Ein von den National Academies of Sciences organisierter Workshop .
Beiträge, Feedback oder Ideen sind willkommen!
Sie können mich gerne kontaktieren oder ein Problem in diesem Repo ansprechen.
(Diese Frage liegt außerhalb meines Fachgebiets.)
Die Richtlinien und Praktiken rund um die Verwendung von KI-Inhalten entwickeln sich noch weiter. Für die Veröffentlichung von Arbeiten im akademischen Umfeld wenden Sie sich jedoch bitte zunächst an Ihren Betreuer, Ihre Abteilung, Ihre Zeitschrift und/oder Ihre Universität.
Bitte beachten Sie auch Folgendes:
„GenAI LaTeX Proofreader“ unterliegt dem Copyright 2024 von Matias Dahl (und Mitwirkenden) und wird unter den Bedingungen der MIT-Open-Source-Lizenz vertrieben.
Teile dieser Arbeit wurden mit KI-gestützten Tools entwickelt.
Einzelheiten finden Sie in der LICENSE-Datei.