K-PageSearch เป็นระบบเครื่องมือค้นหาเว็บระดับมืออาชีพที่พัฒนาโดย Kwindsoft โดยมีการวิเคราะห์อัจฉริยะขั้นสูงและเทคโนโลยีการดึงข้อมูลขนาดใหญ่ ประกอบด้วยสี่ส่วน: ระบบรวบรวมแบบมัลติเธรด ระบบการวิเคราะห์อัจฉริยะ ระบบการจัดทำดัชนีขนาดใหญ่ และระบบเต็มรูปแบบ ระบบการดึงข้อความ ระบบใช้สถาปัตยกรรมระบบเสิร์ชเอ็นจิ้นระดับมืออาชีพ และรองรับการดึงข้อมูลขนาดใหญ่แบบเต็มข้อความในระดับมิลลิวินาที เป็นผลิตภัณฑ์เรียกค้นข้อความแบบเต็มระดับมืออาชีพที่ออกแบบมาสำหรับเครื่องมือค้นหาในอุตสาหกรรมขนาดใหญ่และขนาดกลาง เครื่องมือค้นหาในท้องถิ่น เครื่องมือค้นหาข้อมูลเฉพาะทาง และสาขาแอปพลิเคชันอื่นๆ เป็นหลัก โดยมอบโซลูชั่นในอุดมคติแก่ผู้ใช้สำหรับแอปพลิเคชันเรียกค้นข้อความแบบเต็มที่มีข้อมูลขนาดใหญ่
K-wind web search V2.2 มีการปรับปรุงที่สำคัญ: ปรับปรุงประสิทธิภาพการอ่านและการเขียนของระบบการจัดทำดัชนี, เพิ่มความเร็วในการจัดทำดัชนีประมาณ 10 เท่า;
SP5: แก้ไขและปรับปรุงอัลกอริธึมการค้นหา
SP4: แก้ไขและเพิ่มประสิทธิภาพโปรแกรมหลักบางโปรแกรม
SP3: ปรับกระบวนการดึงข้อมูลให้เหมาะสมและแก้ไขข้อผิดพลาดของโปรแกรม
การปรับปรุง SP2: แก้ไขปัญหาความเร็วในการดึงข้อมูลช้าที่เกิดจากข้อผิดพลาดของส่วนประกอบในการดึงข้อมูล ซึ่งช่วยเพิ่มความเร็วในการดึงข้อมูลได้อย่างมาก
การปรับปรุง SP1: เพิ่มความยาวของค่าแฮช โดยทั่วไปบรรลุคอลเลกชัน 100% รวบรวมข้อมูลหน้าเว็บทั้งเว็บไซต์อย่างสมบูรณ์ และเพิ่มฟังก์ชั่นการค้นหาอันดับสูงสุด
K-wind web search เวอร์ชัน V2.1 มีการปรับปรุงที่สำคัญ: การใช้เทคโนโลยี .NET เพื่อพัฒนาโปรแกรมส่วนหน้าของเว็บ การใช้การเข้ารหัสหน้าเว็บ UTF-8 ระบบการจัดทำดัชนีใหม่ และการเปิดซอร์สโค้ดของเครื่องมือการจัดการ SP1 แก้ไขการระบุอัตโนมัติของการเข้ารหัสหน้าเว็บ และการปรับปรุงการรวบรวมข้อมูล Spider ของแฮชนั้นครอบคลุมมากขึ้น ข้อผิดพลาดในคลังสินค้าที่เกิดขึ้นในสถานการณ์พิเศษได้รับการแก้ไข ฯลฯ
คุณสมบัติของฟังก์ชั่นค้นหาเว็บสไตล์ K
เว็บแมงมุม
เว็บสไปเดอร์ใช้มัลติเธรดเพื่อรวบรวมหน้าเว็บพร้อมกัน รวมกับกลไกการรวบรวมที่มีประสิทธิภาพและการใช้งานเชิงกลยุทธ์ เพื่อเพิ่มประสิทธิภาพสูงสุดของการรวบรวมหน้าเว็บ รองรับการรวบรวมหน้าเว็บที่เป็นเป้าหมายซึ่งเป็นเทคโนโลยีสำคัญสำหรับเครื่องมือค้นหาแนวตั้งเพื่อปรับปรุงคุณภาพข้อมูลและความเกี่ยวข้อง ผู้ใช้สามารถปรับแต่งกฎการรวบรวมเพื่อรวบรวมหน้าเว็บเฉพาะได้ รองรับการรวบรวมหน้าเว็บแบบไดนามิกและแบบคงที่หลายประเภท และการระบุการเข้ารหัสหน้าเว็บหลายภาษาโดยอัตโนมัติ ใช้เทคโนโลยีการขจัดข้อมูลซ้ำซ้อนของหน้าเว็บตารางแฮชซึ่งมีคุณลักษณะประสิทธิภาพสูงและการใช้งานระบบต่ำ ทำให้เว็บสไปเดอร์ทำงานได้อย่างมีประสิทธิภาพและเสถียร รองรับการรวบรวมเว็บไซต์แบบเดี่ยวหรือแบบกลุ่ม การรวบรวมอัตโนมัติ และฟังก์ชันการอัปเดตอัตโนมัติ
การแยกข้อความ
เทคโนโลยีการแยกข้อความหน้าเว็บอัจฉริยะ หน้าที่ของมันคือการแยกเนื้อหาธีมหลักของหน้าเว็บและกรองข้อมูลที่ไม่เกี่ยวข้องกับธีมของหน้าเว็บ (การโฆษณา การนำทาง ลิขสิทธิ์ และข้อมูลเนื้อหาอื่นๆ ที่ไม่ใช่หน้าเว็บ) เทคโนโลยีนี้ปรับปรุงคุณภาพของการรวบรวมข้อมูลหน้าเว็บและความเกี่ยวข้องในการเรียกค้นได้อย่างมีประสิทธิภาพ การระบุอัตโนมัติอัจฉริยะ การแยกข้อความหน้าเว็บที่แม่นยำ และอัตราความแม่นยำมากกว่า 95%
การแบ่งส่วนคำภาษาจีน
เทคโนโลยีการแบ่งส่วนคำภาษาจีนอัจฉริยะตามพจนานุกรมรองรับเทคโนโลยีการวิเคราะห์อัจฉริยะหลายอย่าง เช่น การแบ่งส่วนภาษาจีนและอังกฤษ การแปลงแบบอักษรจีนประยุกต์และดั้งเดิม การแปลงแบบเต็มความกว้างและครึ่งความกว้าง และการจดจำชื่อภาษาจีน ผู้ใช้สามารถขยายและดูแลรักษาคลังคำศัพท์ได้ตามความต้องการใช้งานของตนเองเพื่อให้ได้ผลการแบ่งส่วนคำที่ดีที่สุด
ค้นหาข้อความแบบเต็ม
ใช้สถาปัตยกรรมระบบการจัดทำดัชนีข้อมูลขนาดใหญ่และเทคโนโลยีอัลกอริธึมการดึงข้อความแบบเต็มขั้นสูง ผสมผสานกับกลยุทธ์การเพิ่มประสิทธิภาพการดึงข้อมูลที่มีประสิทธิภาพ เพื่อรองรับความเร็วในการดึงข้อมูลขนาดใหญ่ในระดับมิลลิวินาทีและการดึงข้อมูลพร้อมกันที่มีผู้ใช้หลายราย การค้นหาขั้นสูงรองรับวิธีการค้นหาแบบกำหนดเองเพื่อตอบสนองความต้องการการค้นหาที่แตกต่างกันของผู้ใช้ ใช้กลยุทธ์เทคโนโลยีแคชที่มีประสิทธิภาพเพื่อปรับปรุงความเสถียรของระบบและความสามารถในการโหลด ลดภาระของระบบ และข้อมูลแคชจะได้รับการอัปเดตโดยอัตโนมัติตามเงื่อนไขเฉพาะ
วัตถุที่ใช้งานได้