Paperai هو تطبيق للبحث الدلالي وسير العمل للأوراق الطبية/العلمية.
تتراوح التطبيقات من فهارس البحث الدلالي التي تجد التطابقات للاستعلامات الطبية/العلمية إلى تطبيقات التقارير الكاملة المدعومة بالتعلم الآلي.
تم التعرف على Paperai و/أو NeuML في المقالات التالية:
أسهل طريقة للتثبيت هي عبر النقطة وPyPI
pip install paperai
بايثون 3.8+ مدعوم. يوصى باستخدام بيئة بايثون الافتراضية.
يمكن أيضًا تثبيت Paperai مباشرة من GitHub للوصول إلى أحدث الميزات التي لم يتم إصدارها.
pip install git+https://github.com/neuml/paperai
راجع هذا الارتباط للمساعدة في حل مشكلات التثبيت الخاصة بالبيئة.
قم بتنفيذ الخطوات أدناه لإنشاء صورة عامل إرساء باستخدام الورق وجميع التبعيات.
wget https://raw.githubusercontent.com/neuml/paperai/master/docker/Dockerfile
docker build -t paperai .
docker run --name paperai --rm -it paperai
يمكن إضافة Paperetl للحصول على صورة واحدة لفهرسة المحتوى والاستعلام عنه. اتبع الإرشادات لإنشاء صورة عامل ميناء Paperetl ثم قم بتشغيل ما يلي.
docker build -t paperai --build-arg BASE_IMAGE=paperetl --build-arg START=/scripts/start.sh .
docker run --name paperai --rm -it paperai
توضح دفاتر الملاحظات والتطبيقات التالية الإمكانيات التي توفرها شركة Paperai.
دفتر | وصف | |
---|---|---|
تقديم الورق | نظرة عامة على الوظائف التي توفرها Paperai |
طلب | وصف |
---|---|
يبحث | ابحث في فهرس Paperai. تعيين معلمات الاستعلام وتنفيذ عمليات البحث وعرض النتائج. |
يقوم Paperai بفهرسة قواعد البيانات التي تم إنشاؤها مسبقًا باستخدام Paperetl. يوضح ما يلي كيفية إنشاء فهرس ورقي جديد.
(اختياري) قم بإنشاء ملف Index.yml
يستخدم Paperai تكوين تضمينات txtai الافتراضي عندما لا يتم تحديده. وبدلاً من ذلك، يمكن تحديد ملف Index.yml الذي يأخذ نفس الخيارات مثل مثيل تضمينات txtai. راجع وثائق txtai لمعرفة المزيد عن الخيارات الممكنة. ويرد مثال بسيط أدناه.
path: sentence-transformers/all-MiniLM-L6-v2
content: True
بناء فهرس التضمينات
python -m paperai.index <path to input data> <optional index configuration>
تتطلب عملية Paperai.index مسارًا لبيانات الإدخال وتأخذ تكوين الفهرس اختياريًا. يمكن أن يكون هذا التكوين إما مسار نموذج متجه أو ملف تكوين Index.yml.
أسرع طريقة لتشغيل الاستعلامات هي بدء غلاف ورقي
paperai <path to model directory>
سوف تظهر مطالبة. يمكن كتابة الاستعلامات مباشرة في وحدة التحكم.
تدعم التقارير إنشاء المخرجات بتنسيقات متعددة. مثال لاستدعاء التقرير:
python -m paperai.report report.yml 50 md <path to model directory>
يتم دعم تنسيقات التقارير التالية:
في المثال أعلاه، سيتم إنشاء ملف باسم report.md. يمكن العثور على ملفات تكوين التقرير النموذجية هنا.
Paperai عبارة عن مزيج من فهرس تضمينات txtai وقاعدة بيانات SQLite مع المقالات. يتم تحليل كل مقالة إلى جمل وتخزينها في SQLite مع البيانات التعريفية للمقالة. يتم بناء التضمينات على الجسم الكامل.
توجد نقاط دخول متعددة للتفاعل مع النموذج.