تحسينات SP1: تصحيح التعرف التلقائي على ترميز صفحة الويب، وتحسين التجزئة لجعل الزحف العنكبوتي أكثر شمولاً، وتصحيح أخطاء التخزين في ظروف خاصة، وما إلى ذلك؛ K-PageSearch هو نظام محرك بحث ويب احترافي تم تطويره بشكل مستقل بواسطة Kwindsoft. وهو يتميز بتحليل ذكي متقدم وتقنية ضخمة لاسترجاع البيانات. ويتكون جوهره من أربعة أجزاء: نظام جمع متعدد الخيوط، ونظام تحليل ذكي، ونظام فهرسة ضخم، ونظام كامل. نظام استرجاع النص. يعتمد النظام بنية نظام محرك بحث على المستوى الاحترافي ويدعم استرجاع النص الكامل للبيانات الضخمة على مستوى المللي ثانية. إنه منتج احترافي لاسترجاع النص الكامل مصمم بشكل أساسي لمحركات البحث الصناعية الكبيرة والمتوسطة الحجم، ومحركات البحث المحلية، ومحركات البحث عن المعلومات المتخصصة ومجالات التطبيقات الأخرى، مما يوفر للمستخدمين حلولًا مثالية لتطبيقات استرجاع النص الكامل للبيانات الضخمة. التحسينات الرئيسية للإصدار V2.1: استخدام تقنية .NET لتطوير برامج الواجهة الأمامية للويب، واستخدام ترميز صفحات الويب UTF-8، ونظام فهرسة جديد، وفتح الكود المصدري لأدوات الإدارة؛ الميزات الوظيفية: عنكبوت شبكة متعدد الخيوط، اكتساب اتجاه صفحة الويب، ترميز صفحة الويب متعدد اللغات، التعرف التلقائي، جدول التجزئة، إلغاء البيانات المكررة لصفحة الويب، استخراج نص صفحة الويب الذكي، تجزئة الكلمات الصينية الذكية القائمة على المعجم، تجزئة الكلمات الصينية، المعجم الإدارة، البيانات الضخمة، استرجاع النص الكامل على مستوى المللي ثانية، تقنية التخزين المؤقت، لقطة لصفحة الويب، عطاءات البحث المتقدم، تصنيف عناكب الويب
تستخدم عناكب الويب خيوط متعددة لجمع صفحات الويب بشكل متزامن، جنبًا إلى جنب مع آليات التجميع الفعالة والنشر الاستراتيجي، لزيادة كفاءة جمع صفحات الويب إلى أقصى حد. يدعم المجموعة المستهدفة من صفحات الويب، وهي تقنية رئيسية لمحركات البحث العمودية لتحسين جودة البيانات وأهميتها. يمكن للمستخدمين تخصيص قواعد التجميع لجمع صفحات ويب محددة. يدعم مجموعة من أنواع صفحات الويب الديناميكية والثابتة المتعددة، والتعرف التلقائي على ترميزات صفحات الويب متعددة اللغات. يستخدم تقنية إلغاء البيانات المكررة لصفحات الويب في جدول التجزئة، والتي تتميز بخصائص الأداء العالي والاستخدام المنخفض للنظام، مما يسمح لعناكب الويب بالعمل بكفاءة وثبات. يدعم جمع مواقع الويب الفردية أو المجمعة، والتجميع التلقائي، ووظائف التحديث التلقائي.
استخراج النص
تقنية ذكية لاستخراج نص صفحة الويب، وتتمثل وظيفتها في استخراج محتوى الموضوع المركزي لصفحة الويب وتصفية المعلومات التي لا علاقة لها بموضوع صفحة الويب (الإعلان والملاحة وحقوق الطبع والنشر وغيرها من معلومات المحتوى الأساسي لصفحة الويب). تعمل هذه التقنية على تحسين جودة جمع معلومات صفحة الويب وملاءمتها واسترجاعها، والتعرف التلقائي الذكي، واستخراج نص صفحة الويب بدقة، ومعدل دقة يزيد عن 95%.
تجزئة الكلمات الصينية
تدعم تقنية تجزئة الكلمات الصينية الذكية المستندة إلى المعجم تقنيات التحليل الذكي المتعددة مثل تجزئة الكلمات الصينية والإنجليزية، وتحويل الخطوط الصينية المبسطة والتقليدية، وتحويل العرض الكامل ونصف العرض، والتعرف على الأسماء الصينية. يمكن للمستخدمين توسيع مكتبة المفردات والحفاظ عليها وفقًا لاحتياجات التطبيق الخاصة بهم لتحقيق أفضل تأثير لتجزئة الكلمات.
البحث عن النص الكامل
وهي تعتمد بنية نظام فهرسة البيانات الضخمة وتقنية خوارزمية استرجاع النص الكامل المتقدمة، جنبًا إلى جنب مع استراتيجيات تحسين الاسترجاع الفعالة، لدعم سرعات استرجاع البيانات الضخمة على مستوى المللي ثانية والاسترجاع المتزامن متعدد المستخدمين. يدعم البحث المتقدم طرق البحث المخصصة لتلبية احتياجات البحث المختلفة للمستخدمين. اعتماد إستراتيجيات تقنية التخزين المؤقت الفعالة لتحسين استقرار النظام وسعة التحميل، وتقليل عبء النظام، ويتم تحديث بيانات ذاكرة التخزين المؤقت تلقائيًا وفقًا لظروف محددة.
الكائنات القابلة للتطبيق
مناسبة لمجموعات مواقع الويب الداخلية أو مجموعات مواقع الإنترنت مثل المؤسسات والوكالات الحكومية والمدارس وما إلى ذلك لإنشاء محركات بحث على الويب؛ مناسب لمجموعات مواقع الويب في مختلف الصناعات والمجالات لإنشاء محركات بحث على الويب خاصة بالصناعة؛ مناسب لمجموعات مواقع الويب المحلية مثل المقاطعات والمدن والمناطق لإنشاء محركات بحث محلية على الويب؛