GenAI LaTeX Proofreader هي أداة آلية تستخدم الذكاء الاصطناعي التوليدي للتدقيق اللغوي واقتراح تحسينات على الأوراق العلمية المكتوبة بلغة LaTeX. يتم إلحاق الاقتراحات بملف مصدر LaTeX الأصلي لإنشاء تقرير التدقيق اللغوي. هذه الأداة مخصصة في المقام الأول للمؤلفين الذين يعملون على ورقة علمية.
بمزيد من التفاصيل، يحتوي تقرير التدقيق اللغوي الذي تم إنشاؤه على الورقة الأصلية قيد المراجعة، مع قائمة الاقتراحات المرفقة في بداية كل قسم. لكل قسم، يتم إنشاء التعليقات من منظور شخصيات مختلفة في التدقيق اللغوي. على سبيل المثال، عند كتابة ورقة بحثية، يمكن أن يكون هؤلاء "خبير المجال" و"خبير اللغة الإنجليزية" و"محرر الكتب". ومع ذلك، يمكن أن تتضمن الشخصيات أيضًا شخصيات إضافية مثل "مراجع إحصائي" أو "متخصص LaTeX" أو "خبير لغة شامل" وما إلى ذلك اعتمادًا على موضوع الورقة.
هنا ينبغي تفسير "التدقيق اللغوي" على نطاق واسع. في حين أن نماذج اللغات الكبيرة الحالية (LLMs) تتمتع بفهم للمنطق والرياضيات والفيزياء، إلا أنه لا ينبغي الوثوق بـ LLMs في التدقيق الجاد للنتائج العلمية. وبالتالي، ينبغي تقييم أي اقتراحات بشكل نقدي. من ناحية أخرى، بالنسبة للمؤلفين المطلعين على موضوع ما، يمكن استخدام التقرير الذي تم إنشاؤه لقياس مدى عمق تفكير LLM في الورقة قيد المراجعة.
يتطلب GenAI LaTeX Proofreader الاشتراك في Anthropic API.
من أجل التطوير والاختبار، يتم تقييم GenAI LaTeX Proofreader بانتظام من خلال التدقيق اللغوي في ورقتي اختبار:
بمزيد من التفاصيل، يتم تدقيق هذه الأوراق لجميع عمليات تشغيل CI التي تم تشغيلها يدويًا في هذا الريبو. وبالتالي يمكنك فحص تقارير التدقيق اللغوي التي تم إنشاؤها ( report.pdf
) من مسار CI الأخير الذي تم تشغيله على Github:
التدقيق اللغوي الآلي بالكامل لمستندات LaTeX.
بالإضافة إلى ما سبق، يمكن إضافة شخصيات تدقيق لغوية أخرى. ومع ذلك، يتطلب هذا حاليًا أن يقوم الشخص بتحرير كود مصدر بايثون.
فكرة استخدام شخصيات مختلفة من الذكاء الاصطناعي للتدقيق اللغوي مستوحاة من كتاب إيثان موليك "الذكاء المشترك: العيش والعمل مع الذكاء الاصطناعي" المنشور في 4/2024.
section{..}
الأول لن يتم تدقيقه.section*{..}
.لاحظ أن هذا العمل هو دليل مبكر على المفهوم، لذلك قد تكون هناك حاجة إلى بعض الإلمام بأدوات التطوير (git، وPython، وDocker، وAnthropic API Access) لتفعيل هذا العمل.
تصف الخطوات التالية (للأنظمة التي تعمل بنظام التشغيل Mac/Linux) كيفية تدقيق ورقة بحثية:
الخطوة 1: استنساخ الريبو
git clone [email protected]:genai-latex-proofreader/genai-latex-proofreader.git
cd genai-latex-proofreader
الخطوة 2: إنشاء حاوية Docker (باستخدام Python وLatex)
(cd .devcontainer/latex ; make build)
الخطوة 3: إعداد الرمز السري لواجهة برمجة التطبيقات Anthropic، راجع https://docs.anthropic.com/en/docs/quickstart
export ANTHROPIC_API_KEY= ' your-secret-api-key-here '
(ملاحظة: لا تشارك ANTHROPIC_API_KEY
الخاص بك)
الخطوة 4: انسخ الملفات المطلوبة لإنشاء ورقتك في الدليل الفرعي "الورق للتدقيق" في الريبو.
mkdir paper-to-proofread
cp -R /path/to/your/paper/. paper-to-proofread
للاختبار، يمكنك استخدام ورقة وهمية tests/integration/assets/empty_paper.tex
المتوفرة في الريبو.
mkdir paper-to-proofread
cp -R tests/integration/assets/. paper-to-proofread/
(ملاحظة: يرجى دائمًا الاحتفاظ بنسخة احتياطية من ورقتك.)
الخطوة 5: قم بتشغيل genai-latex-proofreader
(cd .devcontainer/latex ; docker compose run --rm --entrypoint " python3 " genai-latex-proofreader-service -m genai_latex_proofreader.cli --input_latex_path paper-to-proofread/empty_paper.tex --output_report_filepath output/report.tex)
بالنسبة للورقة متوسطة الحجم، سيستغرق ذلك بضع دقائق. إذا نجح كل شيء، يمكن العثور على تقرير التدقيق اللغوي في output/report.pdf
.
اعتمادًا على موضوع ورقتك البحثية، قد ترغب في ضبط المطالبات التي تحدد شخصيات التدقيق اللغوي. حاليًا، يجب تحرير المطالبات مباشرةً في كود مصدر Python.
يستخدم GenAI LaTeX Proofreader GenAI (Generative AI) ونماذج اللغات الكبيرة (LLM) لأتمتة التدقيق اللغوي للأوراق العلمية. اعتبارًا من عام 2024، تعد GenAI تقنية سريعة التطور مع تطورات سريعة.
تحتوي القائمة أدناه على بعض المراجع والأعمال ذات الصلة حول هذا الموضوع، وعلى نطاق أوسع حول استخدام الذكاء الاصطناعي لتحقيق الاكتشافات العلمية:
12/2023، أبحاث مايكروسوفت، تأثير النماذج اللغوية الكبيرة على الاكتشاف العلمي: دراسة أولية باستخدام GPT-4
10/2023، دبليو ليانج وآخرون، هل يمكن لنماذج اللغة الكبيرة تقديم تعليقات مفيدة على الأوراق البحثية؟ تحليل تجريبي واسع النطاق
6/2023، الذكاء الاصطناعي لمساعدة الاستدلال الرياضي: ورشة عمل نظمتها الأكاديميات الوطنية للعلوم.
المساهمات أو ردود الفعل أو الأفكار هي موضع ترحيب!
لا تتردد في الاتصال بي أو إثارة مشكلة في هذا الريبو.
(هذا السؤال خارج نطاق خبرتي.)
لا تزال المبادئ التوجيهية والممارسات المتعلقة باستخدام محتوى الذكاء الاصطناعي في طور التطور. ومع ذلك، لنشر العمل في بيئة أكاديمية، يرجى الرجوع أولاً إلى المستشار أو القسم أو المجلة و/أو الجامعة.
يرجى أيضًا ملاحظة ما يلي:
حقوق الطبع والنشر لـ "GenAI LaTeX Proofreader" محفوظة لعام 2024 لصالح Matias Dahl (والمساهمين)، ويتم توزيعها بموجب شروط ترخيص MIT مفتوح المصدر.
تم تطوير أجزاء من هذا العمل باستخدام أدوات مدعومة بالذكاء الاصطناعي.
لمزيد من التفاصيل، يرجى الاطلاع على ملف الترخيص.