K-PageSearch هو نظام محرك بحث ويب احترافي تم تطويره بشكل مستقل بواسطة Kwindsoft. وهو يتميز بتحليل ذكي متقدم وتقنية ضخمة لاسترجاع البيانات. ويتكون جوهره من أربعة أجزاء: نظام جمع متعدد الخيوط، ونظام تحليل ذكي، ونظام فهرسة ضخم، ونظام كامل. نظام استرجاع النص. يعتمد النظام بنية نظام محرك بحث على المستوى الاحترافي ويدعم استرجاع النص الكامل للبيانات الضخمة على مستوى المللي ثانية. إنه منتج احترافي لاسترجاع النص الكامل مصمم بشكل أساسي لمحركات البحث الصناعية الكبيرة والمتوسطة الحجم، ومحركات البحث المحلية، ومحركات البحث عن المعلومات المتخصصة ومجالات التطبيقات الأخرى، مما يوفر للمستخدمين حلولًا مثالية لتطبيقات استرجاع النص الكامل للبيانات الضخمة.
يحتوي الإصدار 2.2 من بحث الويب K-wind على تحسينات كبيرة: تحسين أداء القراءة والكتابة لنظام الفهرسة، وزيادة سرعة الفهرسة بنحو 10 مرات؛
SP5: تصحيح وتحسين خوارزمية البحث؛
SP4: تصحيح بعض البرامج الأساسية وتحسينها؛
SP3: تحسين عملية الاسترداد وإصلاح أخطاء البرنامج؛
تحسين SP2: تم إصلاح مشكلة سرعة الاسترداد البطيئة الناتجة عن أخطاء مكونات الاسترداد، مما أدى إلى تحسين سرعة الاسترداد بشكل كبير؛
تحسين SP1: زيادة طول قيمة التجزئة، وتحقيق جمع 100٪ بشكل أساسي، والزحف الكامل إلى صفحة الويب الخاصة بالموقع بالكامل، وإضافة وظيفة البحث في أعلى التصنيفات؛
يحتوي الإصدار V2.1 لبحث الويب من K-wind على تحسينات كبيرة: استخدام تقنية .NET لتطوير برامج الواجهة الأمامية للويب، واستخدام ترميز صفحات الويب UTF-8، ونظام فهرسة جديد، وفتح الكود المصدري لأدوات الإدارة؛ تصحيح التحديد التلقائي لترميز صفحة الويب، وتحسين التجزئة. يعد الزحف العنكبوتي أكثر شمولاً، ويتم تصحيح أخطاء التخزين التي تحدث في ظروف خاصة، وما إلى ذلك؛
ميزات وظيفة البحث على الويب بأسلوب K
عنكبوت الويب
تستخدم عناكب الويب خيوط متعددة لجمع صفحات الويب بشكل متزامن، جنبًا إلى جنب مع آليات التجميع الفعالة والنشر الاستراتيجي، لزيادة كفاءة جمع صفحات الويب إلى أقصى حد. يدعم المجموعة المستهدفة من صفحات الويب، وهي تقنية رئيسية لمحركات البحث العمودية لتحسين جودة البيانات وأهميتها. يمكن للمستخدمين تخصيص قواعد التجميع لجمع صفحات ويب محددة. يدعم مجموعة من أنواع صفحات الويب الديناميكية والثابتة المتعددة، والتعرف التلقائي على ترميزات صفحات الويب متعددة اللغات. يستخدم تقنية إلغاء البيانات المكررة لصفحات الويب في جدول التجزئة، والتي تتميز بخصائص الأداء العالي والاستخدام المنخفض للنظام، مما يسمح لعناكب الويب بالعمل بكفاءة وثبات. يدعم جمع مواقع الويب الفردية أو المجمعة، والتجميع التلقائي، ووظائف التحديث التلقائي.
استخراج النص
تقنية ذكية لاستخراج نص صفحة الويب، وتتمثل وظيفتها في استخراج محتوى الموضوع المركزي لصفحة الويب وتصفية المعلومات التي لا علاقة لها بموضوع صفحة الويب (الإعلان والملاحة وحقوق الطبع والنشر وغيرها من معلومات المحتوى الأساسي لصفحة الويب). تعمل هذه التقنية على تحسين جودة جمع معلومات صفحة الويب وملاءمتها واسترجاعها، والتعرف التلقائي الذكي، واستخراج نص صفحة الويب بدقة، ومعدل دقة يزيد عن 95%.
تجزئة الكلمات الصينية
تدعم تقنية تجزئة الكلمات الصينية الذكية المستندة إلى المعجم تقنيات التحليل الذكي المتعددة مثل تجزئة الكلمات الصينية والإنجليزية، وتحويل الخطوط الصينية المبسطة والتقليدية، وتحويل العرض الكامل ونصف العرض، والتعرف على الأسماء الصينية. يمكن للمستخدمين توسيع مكتبة المفردات والحفاظ عليها وفقًا لاحتياجات التطبيق الخاصة بهم لتحقيق أفضل تأثير لتجزئة الكلمات.
البحث عن النص الكامل
وهي تعتمد بنية نظام فهرسة البيانات الضخمة وتقنية خوارزمية استرجاع النص الكامل المتقدمة، جنبًا إلى جنب مع استراتيجيات تحسين الاسترجاع الفعالة، لدعم سرعات استرجاع البيانات الضخمة على مستوى المللي ثانية والاسترجاع المتزامن متعدد المستخدمين. يدعم البحث المتقدم طرق البحث المخصصة لتلبية احتياجات البحث المختلفة للمستخدمين. اعتماد إستراتيجيات تقنية التخزين المؤقت الفعالة لتحسين استقرار النظام وسعة التحميل، وتقليل عبء النظام، ويتم تحديث بيانات ذاكرة التخزين المؤقت تلقائيًا وفقًا لظروف محددة.
الكائنات القابلة للتطبيق