الفرنسية | البرتغالية | الاسبانية | 中文
Parsr ، عبارة عن سلسلة أدوات للتنظيف والتحليل والاستخراج ذات حجم صغير ( image، pdf، docx، eml ) تولد بيانات متاحة بسهولة ومنظمة وقابلة للاستخدام بتنسيقات JSON أو Markdown (MD) أو CSV/Pandas DF أو TXT .
فهو يوفر للمحللين وعلماء البيانات والمطورين مجموعة معلومات منظمة وغنية بالملصقات للتطبيقات الجاهزة للاستخدام بدءًا من إدخال البيانات وأتمتة محللي المستندات والأرشفة وغيرها الكثير.
حاليًا، يستطيع Parsr القيام بما يلي: تنظيف المستندات، وتجديد التسلسل الهرمي (الكلمات، والسطور، والفقرات)، والكشف عن العناوين، والجداول، والقوائم، وجدول المحتويات، وأرقام الصفحات، والرؤوس/التذييلات، والروابط ، وغيرها. تحقق من جميع الميزات.
- دليل التثبيت المتقدم متاح هنا -
أسرع طريقة لتثبيت Parsr API وتشغيلها هي من خلال صورة عامل الإرساء:
docker pull axarev/parsr
إذا كنت ترغب أيضًا في تثبيت واجهة المستخدم الرسومية لإرسال المستندات وتصور النتائج:
docker pull axarev/parsr-ui-localhost
ملحوظة: يمكن أيضًا تثبيت Parsr بدون نظام معدني (وليس عبر حاويات Docker)، وقد تم توثيق الإجراء الخاص به في دليل التثبيت.
- دليل الاستخدام المتقدم متاح هنا -
لتشغيل واجهة برمجة التطبيقات، قم بإصدار:
docker run -p 3001:3001 axarev/parsr
والتي سيتم تشغيله على http://localhost:3001.
راجع الوثائق المتعلقة باستخدام واجهة برمجة التطبيقات (API).
للوصول إلى عميل python إلى Parsr API، قم بإصدار ما يلي:
pip install parsr-client
لتجربة Jupyter Notebook ، باستخدام عميل python، انتقل إلى العرض التوضيحي لـ Jupyter.
docker run -t -p 8080:80 axarev/parsr-ui-localhost:latest
راجع وثائق التكوين لتفسير الخيارات القابلة للتكوين في عارض واجهة المستخدم الرسومية.
تم توثيق الاستخدام المعتمد على واجهة برمجة التطبيقات (API) واستخدام سطر الأوامر في دليل الاستخدام المتقدم.
جميع ملفات الوثائق يمكن العثور عليها هنا.
يرجى الرجوع إلى المبادئ التوجيهية للمساهمة.
تراخيص مكتبات الطرف الثالث لتبعياتها:
حقوق الطبع والنشر لعام 2020 محفوظة لشركة AXA Group Operations SA
مرخص بموجب ترخيص Apache 2.0 (راجع ملف الترخيص).