يعد Viglet Turing ES (https://openviglet.github.io/turing/) حلاً مفتوح المصدر (https://github.com/openturing)، ويتميز بالتنقل الدلالي وروبوت الدردشة كميزاته الرئيسية. يمكنك الاختيار من بين العديد من معالجات البرمجة اللغوية العصبية (NLPs) لإثراء البيانات. تتم فهرسة كل المحتوى في Solr كمحرك بحث.
الوثائق الفنية حول Turing ES متاحة على https://openviglet.github.io/docs/turing/.
لتشغيل Turing ES، ما عليك سوى تنفيذ الأسطر التالية:
# Turing Appmvn -Dmaven.repo.local=D:repo Spring-boot:run -pl turing-app -Dskip.npm# واجهة مستخدم Turing ES جديدة باستخدام Angular 18 وPrimer CSS.cd turing-ui## خدمة تسجيل الدخول موضع ترحيب## Consoleng خدمة وحدة التحكم## Searchngserv sn## Chat botngserv converse
يمكنك بدء تشغيل Turing ES باستخدام MariaDB وSolr وNginx.
عامل الميناء يؤلف
وحدة التحكم الإدارية: http://localhost:2700. (المشرف / المشرف)
نموذج التنقل الدلالي: http://localhost:2700/sn/Sample.
الشكل 1. معمارية تورينج ES
يدعم تورينج مقدمي الخدمات التالية:
Apache OpenNLP عبارة عن مجموعة أدوات تعتمد على التعلم الآلي لمعالجة نص اللغة الطبيعية.
موقع الكتروني: https://opennlp.apache.org/
فهو يحول البيانات إلى رؤى لتحسين اتخاذ القرار وإدارة المعلومات مع تحرير الموارد والوقت.
موقع الكتروني: https://www.opentext.com/
CoreNLP هو متجرك الشامل لمعالجة اللغة الطبيعية في Java! يمكّن CoreNLP المستخدمين من استخلاص التعليقات التوضيحية اللغوية للنص، بما في ذلك حدود الرموز والجمل وأجزاء الكلام والكيانات المسماة والقيم الرقمية والوقتية وتحليلات التبعية والدائرة الانتخابية والمرجع الأساسي والمشاعر ونسب الاقتباس والعلاقات. يدعم CoreNLP حاليًا 6 لغات: العربية والصينية والإنجليزية والفرنسية والألمانية والإسبانية.
الموقع الإلكتروني: https://stanfordnlp.github.io/CoreNLP/،
إنها مكتبة مجانية مفتوحة المصدر لمعالجة اللغات الطبيعية في بايثون. فهو يتميز بعلامات NER ونقاط البيع وتحليل التبعية ومتجهات الكلمات والمزيد.
موقع الكتروني: https://spacy.io
Polyglot عبارة عن خط أنابيب للغة الطبيعية يدعم تطبيقات ضخمة متعددة اللغات.
الموقع الإلكتروني: https://polyglot.readthedocs.io
يمكنه قراءة ملفات PDF والمستندات وتحويلها إلى نص عادي، ويستخدم أيضًا OCR لاكتشاف النص في الصور والصور في المستندات.
يستخدم التنقل الدلالي الموصلات لفهرسة المحتوى من العديد من المصادر.
البرنامج المساعد لـ Apache Nutch لفهرسة المحتوى باستخدام الزاحف.
تعرف على المزيد على https://docs.viglet.com/turing/connectors/#nutch
سطر الأوامر الذي يستخدم نفس مفهوم sqoop (https://sqoop.apache.org/)، لإنشاء استعلامات معقدة وتعيين السمات للفهرسة بناءً على النتيجة.
تعرف على المزيد على https://docs.viglet.com/turing/connectors/#database
سطر الأوامر لفهرسة الملفات واستخراج النص من ملفات مثل Word وExcel وPDF، بما في ذلك الصور، من خلال التعرف الضوئي على الحروف.
تعرف على المزيد على https://docs.viglet.com/turing/connectors/#file-system
مستمع OpenText WEM لنشر المحتوى إلى Viglet Turing.
تعرف على المزيد على https://docs.viglet.com/turing/connectors/#wem
مكون WordPress الإضافي الذي يسمح لك بفهرسة المشاركات.
تعرف على المزيد على https://docs.viglet.com/turing/connectors/#wordpress
باستخدام البرمجة اللغوية العصبية (NLP)، من الممكن اكتشاف كيانات مثل:
الناس
الأماكن
المنظمات
مال
وقت
نسبة مئوية
حدد السمات التي سيتم استخدامها كمرشحات للتنقل، ودمج المحتوى الإجمالي في شاشتك
من خلال السمات المحددة في المحتويات، من الممكن استخدامها لتقييد عرضها بناءً على ملف تعريف المستخدم.
تعمل Java API (https://github.com/openturing/turing-java-sdk) على تسهيل الاستخدام والوصول إلى Viglet Turing ES، دون الحاجة إلى محتوى بحث المستهلك مع الاستعلامات المعقدة.
تواصل مع عميلك ووضح النوايا المعقدة واحصل على التقارير وقم بتطوير تفاعلك تدريجيًا.
مكوناته:
يتعامل مع المحادثات مع المستخدمين النهائيين لديك. إنها وحدة معالجة لغة طبيعية تتفهم الفروق الدقيقة في اللغة البشرية
تصنف النية نية المستخدم النهائي لإجراء تحول في المحادثة. لكل وكيل، يمكنك تحديد عدة أغراض، حيث يمكن لنواياك المجمعة التعامل مع محادثة كاملة.
مجال العمل هو مجال بسيط من الراحة يساعد على تنفيذ المنطق في الخدمة.
تحتوي كل معلمة غرض على نوع، يسمى نوع الكيان، الذي يحدد بالضبط كيفية استخراج البيانات الموجودة في تعبير المستخدم النهائي.
يحدد ويصحح النوايا.
يعرض سجل المحادثات والتقارير.
يكتشف Turing ES كيانات مستندات OpenText Blazon باستخدام OCR وNLP، مما يؤدي إلى إنشاء Blazon XML لإظهار الكيانات في المستند.
يحتوي Turing ES على العديد من المكونات: محرك البحث، البرمجة اللغوية العصبية (NLP)، المحادثة (بوت الدردشة)، التنقل الدلالي
عند الوصول إلى Turing ES، تظهر صفحة تسجيل الدخول. بشكل افتراضي، تسجيل الدخول/كلمة المرور هي admin
/ admin
الشكل 2. صفحة تسجيل الدخول
يستخدم Turing محرك البحث لتخزين واسترجاع بيانات Converse (Chat bot) ومواقع التنقل الدلالي.
الشكل 3. صفحة محرك البحث
من الممكن إنشاء أو تحرير محرك بحث بالسمات التالية:
يصف | وصف |
---|---|
اسم | اسم محرك البحث |
وصف | وصف محرك البحث |
بائع | حدد بائع محرك البحث. في الوقت الحالي، فهو يدعم Solr فقط. |
يستضيف | اسم المضيف حيث تم تثبيت خدمة محرك البحث |
ميناء | ميناء خدمة محرك البحث |
لغة | لغة خدمة محرك البحث. |
ممكّن | إذا تم تمكين محرك البحث. |
الشكل 4. صفحة التنقل الدلالي
تحتوي تفاصيل موقع التنقل الدلالي على السمات التالية:
يصف | وصف |
---|---|
اسم | اسم موقع التنقل الدلالي. |
وصف | وصف موقع التنقل الدلالي. |
محرك البحث | قم باختيار محرك البحث الذي تم إنشاؤه في قسم محرك البحث. سيستخدم موقع التنقل الدلالي محرك البحث هذا لتخزين البيانات واستردادها. |
البرمجة اللغوية العصبية | حدد البرمجة اللغوية العصبية التي تم إنشاؤها في قسم البرمجة اللغوية العصبية. سيستخدم موقع التنقل الدلالي معالجة اللغات الطبيعية هذه لاكتشاف الكيانات أثناء الفهرسة. |
المعجم | إذا كنت تستخدم المعجم. |
لغة | لغة موقع التنقل الدلالي. |
جوهر | اسم جوهر محرك البحث حيث سيتم تخزين البيانات واسترجاعها. |
تحتوي علامة تبويب الحقول على جدول يحتوي على الأعمدة التالية: أعمدة حقول موقع التنقل الدلالي
اسم العمود | وصف |
---|---|
يكتب | نوع المجال. يمكن أن يكون: - NER (التعرف على الكيانات المسماة) الذي تستخدمه البرمجة اللغوية العصبية. - محرك البحث المستخدم بواسطة Solr. |
مجال | اسم المجال. |
ممكّن | إذا كان الحقل ممكّنًا أم لا. |
ملت | إذا كان سيتم استخدام هذا الحقل في MLT. |
الأوجه | لاستخدام هذا الحقل كواجهة (مرشح) |
تسليط الضوء | إذا كان هذا الحقل سيظهر الخطوط المميزة. |
البرمجة اللغوية العصبية | إذا كانت ستتم معالجة هذا الحقل بواسطة البرمجة اللغوية العصبية (NLP) لاكتشاف الكيانات (NER) مثل الأشخاص والمؤسسة والمكان. |
عند النقر فوق الحقل تظهر صفحة جديدة تحتوي على تفاصيل الحقل بالسمات التالية:
يصف | وصف |
---|---|
اسم | اسم المجال |
وصف | وصف المجال |
يكتب | نوع المجال. يمكن أن تكون: |
متعدد القيم | إذا كانت مصفوفة |
اسم الوجه | اسم تسمية الوجه (الفلتر) في صفحة البحث. |
الوجه | لاستخدام هذا الحقل كواجهة (مرشح) |
تسليط الضوء | إذا كان هذا الحقل سيظهر الخطوط المميزة. |
ملت | إذا كان سيتم استخدام هذا الحقل في MLT. |
ممكّن | إذا تم تمكين الحقل. |
مطلوب | إذا كان الحقل مطلوبا. |
القيمة الافتراضية | في حالة فهرسة المحتوى بدون هذه الحقول، فهذه هي القيمة الافتراضية. |
البرمجة اللغوية العصبية | إذا كانت ستتم معالجة هذا الحقل بواسطة البرمجة اللغوية العصبية (NLP) لاكتشاف الكيانات (NER) مثل الأشخاص والمؤسسة والمكان. |
يحتوي على السمات التالية:
قسم | يصف | وصف |
---|---|---|
مظهر | عدد العناصر في كل صفحة | عدد العناصر التي ستظهر في البحث. |
الوجه | تمكين الوجه؟ | إذا كان سيتم عرض الوجه (المرشحات) في البحث. |
عدد العناصر لكل وجه | عدد العناصر التي ستظهر في كل وجه (مرشح). | |
تسليط الضوء | تسليط الضوء على تمكين؟ | حدد ما إذا كنت تريد إظهار الخطوط المميزة أم لا. |
العلامة المسبقة | علامة HTML التي سيتم استخدامها في بداية الفصل الدراسي. على سبيل المثال: <علامة> | |
مشاركة العلامة | علامة HTML التي سيتم استخدامها في نهاية الفصل الدراسي. على سبيل المثال: مارك> | |
ملت | هل تم تفعيل المزيد من الإعجاب بهذا؟ | حدد ما إذا كنت تريد إظهار MLT أم لا |
الحقول الافتراضية | عنوان | الحقل الذي سيتم استخدامه كعنوان تم تعريفه في Solr schema.xml |
نص | الحقل الذي سيتم استخدامه كعنوان تم تعريفه في Solr schema.xml | |
وصف | الحقل الذي سيتم استخدامه كوصف تم تعريفه في Solr schema.xml | |
تاريخ | الحقل الذي سيتم استخدامه كتاريخ محدد في Solr schema.xml | |
صورة | الحقل الذي سيتم استخدامه كعنوان URL للصورة المحددة في Solr schema.xml | |
عنوان URL | الحقل الذي سيتم استخدامه كعنوان URL الذي تم تعريفه في Solr schema.xml |
في Turing ES Console
> Semantic Navigation
>
، انقر فوق الزر Configure
وانقر فوق الزر Search Page
.
سيتم فتح صفحة بحث تستخدم النمط:
احصل على http://localhost:2700/sn/
تطلب هذه الصفحة واجهة برمجة تطبيقات Turing Rest عبر AJAX. على سبيل المثال، لإرجاع جميع نتائج موقع التنقل الدلالي بتنسيق JSON:
احصل على http://localhost:2700/api/sn//search?p=1&q=*&sort=relevance
يصف | مطلوب / اختياري | وصف | مثال |
---|---|---|---|
س | مطلوب | استعلام البحث. | س=فو |
ص | مطلوب | رقم الصفحة، الصفحة الأولى هي 1. | ع = 1 |
نوع | مطلوب | فرز القيم: | فرز=أهمية |
سؤال متكرر[] | خياري | حقل الاستعلام. قم بالتصفية حسب الحقل، باستخدام النمط التالي: FIELD : VALUE . | fq[]=title:bar |
آر[] | خياري | قاعدة الاستهداف تقييد البحث بناءً على: FIELD : VALUE . | tr[]=department:foobar |
صفوف | خياري | عدد الصفوف التي سيرجعها الاستعلام. | الصفوف = 10 |
على الشبكة الداخلية لشركة التأمين تستخدم OpenText WEM وOpenText Portal المتكاملين مع وحدة البوابة الديناميكية، وتم إنشاء بحث موحد في Viglet Turing ES، باستخدام الموصلات: WEM، وقاعدة البيانات مع نظام الملفات. وبهذه الطريقة كان من الممكن عرض جميع محتويات وملفات شبكة البحث الداخلية، مع قواعد الاستهداف، مما يسمح فقط بعرض المحتوى الذي حصل المستخدم على إذن به. تصل OpenText Portal إلى Viglet Turing ES Java API، لذلك لم يكن من الضروري إنشاء استعلامات معقدة لإرجاع النتائج.
تم إنشاء مجموعة API Rest لجعل كل محتوى الشركة الحكومية متاحًا للشركاء. كل هذه المحتويات موجودة في OpenText WEM وتم استخدام موصل WEM لفهرسة المحتويات في Viglet Turing ES. تم إنشاء تطبيق Spring Boot باستخدام مجموعة Rest API التي تستهلك محتوى Turing ES من خلال Viglet Turing ES Java API.
تم تطوير موقع الجامعة البرازيلية باستخدام Viglet Shio CMS (https://viglet.com/shio)، ويتم فهرسة جميع المحتويات في Viglet Turing ES تلقائيًا. تم إجراء هذا التكوين في نمذجة المحتوى وتم تطوير قالب البحث في Viglet Shio CMS.