การปรับปรุง SP1: แก้ไขการจดจำการเข้ารหัสหน้าเว็บโดยอัตโนมัติ ปรับปรุงการแฮชเพื่อให้การรวบรวมข้อมูลของสไปเดอร์ครอบคลุมมากขึ้น แก้ไขข้อผิดพลาดในคลังสินค้าในกรณีพิเศษ ฯลฯ
K-PageSearch เป็นระบบเครื่องมือค้นหาเว็บระดับมืออาชีพที่พัฒนาโดย Kwindsoft โดยมีการวิเคราะห์อัจฉริยะขั้นสูงและเทคโนโลยีการดึงข้อมูลขนาดใหญ่ ประกอบด้วยสี่ส่วน: ระบบรวบรวมแบบมัลติเธรด ระบบการวิเคราะห์อัจฉริยะ ระบบการจัดทำดัชนีขนาดใหญ่ และระบบเต็มรูปแบบ ระบบการดึงข้อความ ระบบใช้สถาปัตยกรรมระบบเสิร์ชเอ็นจิ้นระดับมืออาชีพ และรองรับการดึงข้อมูลขนาดใหญ่แบบเต็มข้อความในระดับมิลลิวินาที เป็นผลิตภัณฑ์เรียกค้นข้อความแบบเต็มระดับมืออาชีพที่ออกแบบมาสำหรับเครื่องมือค้นหาในอุตสาหกรรมขนาดใหญ่และขนาดกลาง เครื่องมือค้นหาในท้องถิ่น เครื่องมือค้นหาข้อมูลเฉพาะทาง และสาขาแอปพลิเคชันอื่นๆ เป็นหลัก โดยมอบโซลูชั่นในอุดมคติแก่ผู้ใช้สำหรับแอปพลิเคชันเรียกค้นข้อความแบบเต็มที่มีข้อมูลขนาดใหญ่
การปรับปรุงหลักของเวอร์ชัน V2.1: การใช้เทคโนโลยี .NET เพื่อพัฒนาโปรแกรมส่วนหน้าของเว็บ การใช้การเข้ารหัสหน้าเว็บ UTF-8 ระบบการจัดทำดัชนีใหม่ และการเปิดซอร์สโค้ดของเครื่องมือการจัดการ
คุณสมบัติการทำงาน: สไปเดอร์เครือข่ายแบบมัลติเธรด, การได้มาซึ่งทิศทางของหน้าเว็บ, การเข้ารหัสหน้าเว็บหลายภาษา, การจดจำอัตโนมัติ, ตารางแฮช, การขจัดข้อมูลซ้ำซ้อนของหน้าเว็บ, การแยกข้อความหน้าเว็บอัจฉริยะ, การแบ่งส่วนคำภาษาจีนอัจฉริยะตามพจนานุกรม, การแบ่งส่วนคำภาษาจีน, พจนานุกรม การจัดการ, ข้อมูลขนาดใหญ่, การดึงข้อความแบบเต็มระดับมิลลิวินาที, เทคโนโลยีแคช, สแนปช็อตหน้าเว็บ, การเสนอราคาการค้นหาขั้นสูง การจัดอันดับเว็บสไปเดอร์
เว็บสไปเดอร์ใช้มัลติเธรดเพื่อรวบรวมหน้าเว็บพร้อมกัน รวมกับกลไกการรวบรวมที่มีประสิทธิภาพและการใช้งานเชิงกลยุทธ์ เพื่อเพิ่มประสิทธิภาพสูงสุดของการรวบรวมหน้าเว็บ รองรับการรวบรวมหน้าเว็บที่เป็นเป้าหมายซึ่งเป็นเทคโนโลยีสำคัญสำหรับเครื่องมือค้นหาแนวตั้งเพื่อปรับปรุงคุณภาพข้อมูลและความเกี่ยวข้อง ผู้ใช้สามารถปรับแต่งกฎการรวบรวมเพื่อรวบรวมหน้าเว็บเฉพาะได้ รองรับการรวบรวมหน้าเว็บแบบไดนามิกและแบบคงที่หลายประเภท และการระบุการเข้ารหัสหน้าเว็บหลายภาษาโดยอัตโนมัติ ใช้เทคโนโลยีการขจัดข้อมูลซ้ำซ้อนของหน้าเว็บตารางแฮชซึ่งมีคุณลักษณะประสิทธิภาพสูงและการใช้งานระบบต่ำ ทำให้เว็บสไปเดอร์ทำงานได้อย่างมีประสิทธิภาพและเสถียร รองรับการรวบรวมเว็บไซต์แบบเดี่ยวหรือแบบกลุ่ม การรวบรวมอัตโนมัติ และฟังก์ชันการอัปเดตอัตโนมัติ
การแยกข้อความ
เทคโนโลยีการแยกข้อความหน้าเว็บอัจฉริยะ หน้าที่ของมันคือการแยกเนื้อหาธีมหลักของหน้าเว็บและกรองข้อมูลที่ไม่เกี่ยวข้องกับธีมของหน้าเว็บ (การโฆษณา การนำทาง ลิขสิทธิ์ และข้อมูลเนื้อหาอื่นๆ ที่ไม่ใช่หน้าเว็บ) เทคโนโลยีนี้ปรับปรุงคุณภาพของการรวบรวมข้อมูลหน้าเว็บและความเกี่ยวข้องในการเรียกค้นได้อย่างมีประสิทธิภาพ การระบุอัตโนมัติอัจฉริยะ การแยกข้อความหน้าเว็บที่แม่นยำ และอัตราความแม่นยำมากกว่า 95%
การแบ่งส่วนคำภาษาจีน
เทคโนโลยีการแบ่งส่วนคำภาษาจีนอัจฉริยะตามพจนานุกรมรองรับเทคโนโลยีการวิเคราะห์อัจฉริยะหลายอย่าง เช่น การแบ่งส่วนภาษาจีนและอังกฤษ การแปลงแบบอักษรจีนประยุกต์และดั้งเดิม การแปลงแบบเต็มความกว้างและครึ่งความกว้าง และการจดจำชื่อภาษาจีน ผู้ใช้สามารถขยายและดูแลรักษาคลังคำศัพท์ได้ตามความต้องการใช้งานของตนเองเพื่อให้ได้ผลการแบ่งส่วนคำที่ดีที่สุด
ค้นหาข้อความแบบเต็ม
ใช้สถาปัตยกรรมระบบการจัดทำดัชนีข้อมูลขนาดใหญ่และเทคโนโลยีอัลกอริธึมการดึงข้อความแบบเต็มขั้นสูง ผสมผสานกับกลยุทธ์การเพิ่มประสิทธิภาพการดึงข้อมูลที่มีประสิทธิภาพ เพื่อรองรับความเร็วในการดึงข้อมูลขนาดใหญ่ในระดับมิลลิวินาทีและการดึงข้อมูลพร้อมกันที่มีผู้ใช้หลายราย การค้นหาขั้นสูงรองรับวิธีการค้นหาแบบกำหนดเองเพื่อตอบสนองความต้องการการค้นหาที่แตกต่างกันของผู้ใช้ ใช้กลยุทธ์เทคโนโลยีแคชที่มีประสิทธิภาพเพื่อปรับปรุงความเสถียรของระบบและความสามารถในการโหลด ลดภาระของระบบ และข้อมูลแคชจะได้รับการอัปเดตโดยอัตโนมัติตามเงื่อนไขเฉพาะ
วัตถุที่ใช้งานได้
เหมาะสำหรับกลุ่มเว็บไซต์ภายในหรือกลุ่มเว็บไซต์อินเทอร์เน็ต เช่น องค์กร หน่วยงานราชการ โรงเรียน ฯลฯ เพื่อสร้างโปรแกรมค้นหาเว็บ
เหมาะสำหรับกลุ่มเว็บไซต์ในอุตสาหกรรมและสาขาต่างๆ เพื่อสร้างเครื่องมือค้นหาเว็บอุตสาหกรรม
เหมาะสำหรับกลุ่มเว็บไซต์ท้องถิ่น เช่น จังหวัด เมือง และเขต เพื่อสร้างเครื่องมือค้นหาเว็บในท้องถิ่น
ขยาย