راجع meertensinstituut.github.io/mtas/ لمزيد من الوثائق والتعليمات.
تتوفر صورة عامل إرساء توفر سيناريو توضيحي قائم على Solr مع الفهرسة والاستعلام عن بعض نماذج المستندات. للسحب والتشغيل
docker pull textexploration/mtas
docker run -t -i -p 8080:80 --name mtas textexploration/mtas
أو للبناء والتشغيل
docker build -t mtas https://raw.githubusercontent.com/textexploration/mtas/master/docker/Dockerfile
docker run -t -i -p 8080:80 --name mtas mtas
سيوفر هذا موقع ويب على المنفذ 8080 على عنوان IP الخاص بمضيف عامل الإرساء الخاص بك بمزيد من المعلومات.
إحدى حالات الاستخدام الأساسية لـ Mtas، مشروع Nederlab، حاليًا 1 يوفر الوصول، سواء من حيث البيانات الوصفية أو النص المشروح، إلى أكثر من 74 مليون عنصر للبحث والتحليل كما هو محدد أدناه.
المجموع | يقصد | دقيقة | الأعلى | |
---|---|---|---|---|
حجم مؤشر Solr | 2,715 ج | 60.3 ج | 75 ك | 288 ج |
وثائق سولر | 74,762,559 | 1,661,390 | 119 | 11,912,415 |
تتم إضافة المجموعات وتحديثها بانتظام عن طريق إضافة مراكز جديدة و/أو استبدال المراكز و/أو دمج المراكز الجديدة مع المراكز الموجودة. حاليًا، يتم تقسيم البيانات على 44 مركزًا منفصلاً. بالنسبة لـ 41,437,881 من هذه المستندات، تم تضمين نص مشروح يتراوح حجمه من 1 إلى أكثر من 3.5 مليون كلمة:
المجموع | يقصد | دقيقة | الأعلى | |
---|---|---|---|---|
كلمات | 18,494,454,357 | 446 | 1 | 3,537,883 |
الشروح | 95,921,919,849 | 2,314 | 4 | 23,589,831 |
1 حالة يونيو 2018
حقوق الطبع والنشر 2017-2018 Koninklijke Nederlandse Academie van Wetenschappen
مرخص بموجب ترخيص Apache، الإصدار 2.0 ("الترخيص")؛ لا يجوز لك استخدام هذا الملف إلا وفقًا للترخيص. يمكنك الحصول على نسخة من الترخيص على
http://www.apache.org/licenses/LICENSE-2.0
ما لم يكن ذلك مطلوبًا بموجب القانون المعمول به أو تم الاتفاق عليه كتابيًا، يتم توزيع البرامج الموزعة بموجب الترخيص على أساس "كما هي"، دون ضمانات أو شروط من أي نوع، سواء كانت صريحة أو ضمنية. راجع الترخيص لمعرفة الأذونات والقيود التي تحكم اللغة المحددة بموجب الترخيص.