الإنجليزية | 简体中文
PDF ترجمة الورق العلمي والمقارنة ثنائية اللغة.
لا تتردد في تقديم ملاحظات في قضايا Github ، مجموعة Telegram أو QQ Group.
يمكنك تجربة الخدمة العامة عبر الإنترنت دون التثبيت.
يمكنك تجربة العرض التوضيحي الخاص بنا على Luggingface دون التثبيت. لاحظ أن موارد الحوسبة للعروض التوضيحية محدودة ، لذا يرجى تجنب إساءة استخدامها.
نحن نقدم ثلاث طرق لاستخدام هذا المشروع: سطر الأوامر ، واجهة المستخدم الرسومية ، و Docker.
Python مثبت (3.8 <= الإصدار <= 3.12)
قم بتثبيت الحزمة الخاصة بنا:
pip install pdf2zh
تنفيذ الترجمة ، والملفات التي تم إنشاؤها في دليل العمل الحالي:
pdf2zh document.pdf
Python مثبت (3.8 <= الإصدار <= 3.12)
قم بتثبيت الحزمة الخاصة بنا:
pip install pdf2zh
ابدأ باستخدام في المتصفح:
pdf2zh -i
إذا لم يتم تشغيل browswer الخاص بك تلقائيًا ، فسيتو غوتو
http://localhost:7860/
انظر وثائق واجهة المستخدم الرسومية لمزيد من التفاصيل.
سحب وتشغيل:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
مفتوح في المتصفح:
http://localhost:7860/
لنشر Docker على الخدمة السحابية:
قم بتنفيذ أمر الترجمة في سطر الأوامر لإنشاء example-zh.pdf
ومثال مستند ثنائي اللغة example-dual.pdf
في دليل العمل الحالي. استخدم Google كخدمة الترجمة الافتراضية.
في الجدول التالي ، ندرج جميع الخيارات المتقدمة للرجوع إليها:
خيار | وظيفة | مثال |
---|---|---|
الملفات | الملفات المحلية | pdf2zh ~/local.pdf |
الروابط | الملفات عبر الإنترنت | pdf2zh http://arxiv.org/paper.pdf |
-i | أدخل واجهة المستخدم الرسومية | pdf2zh -i |
-p | ترجمة الوثيقة الجزئية | pdf2zh example.pdf -p 1 |
-li | لغة المصدر | pdf2zh example.pdf -li en |
-lo | اللغة المستهدفة | pdf2zh example.pdf -lo zh |
-s | خدمة الترجمة | pdf2zh example.pdf -s deepl |
-t | متعددة | pdf2zh example.pdf -t 1 |
-o | إخراج dir | pdf2zh example.pdf -o output |
-f ، -c | استثناءات | pdf2zh example.pdf -f "(MS.*)" |
تتطلب بعض الخدمات تحديد المتغيرات البيئية.
وثيقة كاملة
pdf2zh example.pdf
جزء من الوثيقة
pdf2zh example.pdf -p 1-3,5
انظر رموز لغات Google ورموز لغات Deepl
pdf2zh example.pdf -li en -lo ja
ديب
انظر ديب
تعيين envs لبناء نقطة نهاية مثل: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL
(اختياري) ، على سبيل المثال ، export DEEPL_SERVER_URL=https://api.deepl.com
DEEPL_AUTH_KEY
، على سبيل المثال ، export DEEPL_AUTH_KEY=xxx
pdf2zh example.pdf -s deepl
ديبلكس
انظر Deeplx
تعيين envs لبناء نقطة نهاية مثل: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL
(اختياري) ، على سبيل المثال ، export DEEPLX_SERVER_URL=https://api.deeplx.org
DEEPLX_AUTH_KEY
، على سبيل المثال ، export DEEPLX_AUTH_KEY=xxx
pdf2zh example.pdf -s deeplx
أولاما
انظر أولاما
اضبط Envs لبناء نقطة نهاية مثل: {OLLAMA_HOST}/api/chat
OLLAMA_HOST
(اختياري) ، على سبيل المثال ، export OLLAMA_HOST=https://localhost:11434
pdf2zh example.pdf -s ollama:gemma2
LLM مع مخططات متوافقة مع Openai (Openai / SiliconCloud / Zhipu)
انظر Siliconcloud ، Zhipu
اضبط Envs لبناء نقطة نهاية مثل: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL
(اختياري) ، على سبيل المثال ، export OPENAI_BASE_URL=https://api.openai.com/v1
OPENAI_API_KEY
، على سبيل المثال ، export OPENAI_API_KEY=xxx
pdf2zh example.pdf -s openai:gpt-4o
أزور
انظر Azure Text Translation
يلي البيئة المطلوبة:
AZURE_APIKEY
، على سبيل المثال ، export AZURE_APIKEY=xxx
AZURE_ENDPOINT
، على سبيل المثال ، export AZURE_ENDPOINT=https://api.translator.azure.cn/
AZURE_REGION
، على سبيل المثال ، export AZURE_REGION=chinaeast2
pdf2zh example.pdf -s azure
ترجمة الآلة tencent
انظر الترجمة الآلية tencent
يلي البيئة المطلوبة:
TENCENT_SECRET_ID
، على سبيل المثال ، export TENCENT_SECRET_ID=AKIDxxx
TENCENT_SECRET_KEY
، على سبيل المثال ، export TENCENT_SECRET_KEY=xxx
pdf2zh example.pdf -s tencent
استخدم Regex لتحديد خطوط الصيغة والأحرف التي تحتاج إلى الحفاظ عليها:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) "
استخدم -t
لتحديد عدد المواضيع التي يجب استخدامها في الترجمة:
pdf2zh example.pdf -t 1
تخطيط تحليل مع Paddlex ، papermage ، sam2
إصلاح دوران الصفحة ، جدول المحتويات ، تنسيق القائمة
إصلاح صيغة بكسل في الورق القديم
دعم لغة متعددة مع Noto Font ، أوبونتو الخط
أعد إعادة المحاولة باستثناء لوحة المفاتيح
دمج المستند: Pymupdf
تحليل المستندات: pdfminer.six
استخراج المستند: Mineru
ترجمة متعددة الخيوط: Mathtranslate
تخطيط التحليل: DoClayout-Yolo
معيار المستند: شرح PDF ، أوراق الغش في PDF