GenAI LaTeX Proofreader — это автоматизированный инструмент, который использует генеративный искусственный интеллект для корректуры и предложения улучшений в научных статьях, написанных в LaTeX. Предложения добавляются в исходный исходный файл LaTeX, создавая отчет о корректуре. Этот инструмент в первую очередь предназначен для авторов, работающих над научной статьей.
Более подробно, созданный отчет о корректуре содержит исходную рецензируемую статью со списком предложений, прикрепленных в начале каждого раздела. По каждому разделу создается обратная связь с точки зрения разных корректоров. Например, при написании статьи это могут быть «Эксперт предметной области», «Эксперт английского языка» и «Редактор книги». Однако персонажи могут также включать дополнительные персонажи, такие как «Статистический обозреватель», «Специалист по LaTeX» или «Эксперт по инклюзивному языку» и т. Д. В зависимости от темы статьи.
Здесь «корректуру» следует понимать широко. Хотя современные модели больших языков (LLM) понимают логику, математику и физику, им не следует доверять серьезную корректуру научных результатов. Поэтому любые предложения следует оценивать критически. С другой стороны, для авторов, знакомых с темой, созданный отчет может использоваться для оценки того, насколько глубоко LLM может рассуждать о рецензируемой статье.
GenAI LaTeX Proofreader требует подписки на Anthropic API.
При разработке и тестировании GenAI LaTeX Proofreader регулярно оценивается путем корректуры двух тестовых документов:
Более подробно, эти документы проверены для всех запускаемых вручную запусков CI в этом репозитории. Таким образом, вы можете проверить сгенерированные отчеты о корректуре ( report.pdf
) из недавних запусков конвейера CI на Github:
Полностью автоматизированная корректура документов LaTeX.
Помимо вышеперечисленных, можно добавить и других корректоров. Однако в настоящее время для этого требуется редактировать исходный код Python.
Идея использования разных персонажей ИИ для корректуры вдохновлена книгой Итана Моллика «Совместный интеллект: жизнь и работа с ИИ», опубликованной 4 апреля 2024 года.
section{..}
не будет корректироваться.section*{..}
.Обратите внимание, что эта работа является ранней проверкой концепции, поэтому для того, чтобы это заработало, может потребоваться некоторое знакомство с инструментами разработки (git, Python, Docker, доступ к Anthropic API).
Следующие шаги (для систем на базе Mac/Linux) описывают, как вычитать статью:
Шаг 1. Клонируйте репозиторий
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
Шаг 2. Создайте контейнер Docker (с помощью Python и Latex).
(cd .devcontainer/latex ; make build)
Шаг 3. Настройте секретный токен для Anthropic API, см. https://docs.anthropic.com/en/docs/quickstart.
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(Примечание: не делитесь своим ANTHROPIC_API_KEY
)
Шаг 4. Скопируйте файлы, необходимые для создания статьи, в подкаталог «бумага для корректуры» в репозитории.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
Для тестирования вы можете использовать фиктивный tests/integration/assets/empty_paper.tex
представленный в репозитории.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(Примечание: всегда имейте резервную копию документа.)
Шаг 5. Запустите genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
Для бумаги среднего размера это займет несколько минут. Если все сработало, отчет о корректуре можно найти в output/report.pdf
.
В зависимости от темы вашей статьи вы можете настроить подсказки, определяющие персонажей, выполняющих корректуру. В настоящее время подсказки необходимо редактировать непосредственно в исходном коде Python.
GenAI LaTeX Proofreader использует GenAI (генеративный искусственный интеллект) и модели большого языка (LLM) для автоматизации корректуры научных статей. По состоянию на 2024 год GenAI станет быстро развивающейся технологией.
В приведенном ниже списке содержатся некоторые ссылки и связанные работы по этой теме, а также в более широком смысле об использовании ИИ для научных открытий:
12 декабря 2023 г., Microsoft Research, Влияние больших языковых моделей на научные открытия: предварительное исследование с использованием GPT-4.
10/2023, В. Лян и др., Могут ли большие языковые модели обеспечить полезную обратную связь в исследовательских работах? Масштабный эмпирический анализ
6/2023, Искусственный интеллект в помощь математическому рассуждению: семинар, организованный Национальными академиями наук.
Вклады, отзывы и идеи приветствуются!
Не стесняйтесь обращаться ко мне или поднимать проблему в этом репозитории.
(Этот вопрос выходит за рамки моей компетенции.)
Рекомендации и практика использования AI-контента все еще развиваются. Однако для публикации работы в академических целях сначала обратитесь к своему научному руководителю, на кафедру, в журнал и/или университет.
Также обратите внимание, что:
Авторские права на «GenAI LaTeX Proofreader» принадлежат Матиасу Далю (и его участникам), 2024 г., и распространяются на условиях лицензии MIT с открытым исходным кодом.
Части этой работы были разработаны с использованием инструментов искусственного интеллекта.
Подробную информацию см. в файле ЛИЦЕНЗИИ.