Kwind adalah sistem mesin pencari web profesional yang dikembangkan secara independen oleh Kwindsoft. Sistem ini memiliki analisis cerdas canggih dan teknologi pengambilan data besar-besaran. Intinya terdiri dari empat bagian: sistem pengumpulan multi-utas, sistem analisis cerdas, sistem pengindeksan besar-besaran, dan pengambilan teks lengkap. sistem. Sistem ini mengadopsi arsitektur sistem mesin pencari tingkat profesional dan mendukung pengambilan teks lengkap tingkat milidetik dari data dalam jumlah besar. Ini adalah produk pengambilan teks lengkap profesional yang dirancang terutama untuk mesin pencari industri besar dan menengah, mesin pencari lokal, mesin pencari informasi khusus, dan bidang aplikasi lainnya, memberikan solusi ideal kepada pengguna untuk aplikasi pengambilan teks lengkap dari data yang sangat besar.
Peningkatan utama sistem mesin pencari web Kwind versi 2.2SP5:
Peningkatan utama di versi 2.2: Peningkatan kinerja baca dan tulis sistem pengindeksan, meningkatkan kecepatan pengindeksan sekitar 10 kali lipat;
SP5: Memperbaiki dan meningkatkan algoritma pencarian;
SP4: Memperbaiki dan mengoptimalkan beberapa program inti;
SP3: Mengoptimalkan proses pengambilan dan memperbaiki kesalahan program;
Peningkatan SP2: Memperbaiki masalah kecepatan pengambilan yang lambat yang disebabkan oleh kesalahan komponen pengambilan, sangat meningkatkan kecepatan pengambilan;
Peningkatan SP1: Meningkatkan panjang nilai hash, yang pada dasarnya dapat mencapai 100 koleksi, merayapi seluruh halaman web situs sepenuhnya, dan menambahkan fungsi pencarian peringkat teratas;;
Fitur:
Laba-laba web multi-utas
Koleksi bertarget halaman web
Pengenalan otomatis pengkodean halaman web multi-bahasa
Deduplikasi halaman web tabel hash
Ekstraksi teks halaman web yang cerdas
Segmentasi kata Cina yang cerdas berdasarkan tesaurus
Manajemen kamus segmentasi kata Cina
Pengambilan teks lengkap tingkat milidetik dari data yang sangat besar
teknologi cache
Cuplikan halaman web
Pencarian lanjutan
PPC
laba-laba jaring
Laba-laba web menggunakan multi-utas untuk mengumpulkan halaman web secara bersamaan, dikombinasikan dengan mekanisme pengumpulan yang efisien dan penerapan strategis, untuk memaksimalkan efisiensi pengumpulan halaman web. Mendukung pengumpulan halaman web yang ditargetkan, teknologi utama bagi mesin pencari vertikal untuk meningkatkan kualitas dan relevansi data. Pengguna dapat menyesuaikan aturan pengumpulan untuk mengumpulkan halaman web tertentu. Mendukung pengumpulan beberapa jenis halaman web dinamis dan statis, dan identifikasi otomatis pengkodean halaman web multi-bahasa. Ini menggunakan teknologi deduplikasi halaman web tabel hash, yang memiliki karakteristik kinerja tinggi dan penggunaan sistem rendah, memungkinkan laba-laba web berjalan secara efisien dan stabil. Mendukung pengumpulan situs web tunggal atau batch, pengumpulan otomatis, dan fungsi pembaruan otomatis.
Ekstraksi teks
Teknologi ekstraksi teks halaman web yang cerdas, fungsinya untuk mengekstrak konten tema sentral halaman web dan menyaring informasi yang tidak terkait dengan tema halaman web (iklan, navigasi, hak cipta, dan informasi konten isi halaman non-web lainnya). Teknologi ini secara efektif meningkatkan kualitas relevansi pengumpulan dan pengambilan informasi halaman web, identifikasi otomatis cerdas, ekstraksi teks halaman web yang akurat, dan tingkat akurasi lebih dari 95%.
Segmentasi kata Cina
Teknologi segmentasi kata berbahasa Mandarin yang cerdas berdasarkan tesaurus mendukung berbagai teknologi analisis cerdas seperti segmentasi bahasa Mandarin dan Inggris, konversi font sederhana dan tradisional berbahasa Mandarin, konversi lebar penuh dan setengah lebar, serta pengenalan nama berbahasa Mandarin. Pengguna dapat memperluas dan memelihara perpustakaan kosakata sesuai dengan kebutuhan aplikasi mereka untuk mencapai efek segmentasi kata terbaik.
Pencarian teks lengkap
Ini mengadopsi arsitektur sistem pengindeksan data besar-besaran dan teknologi algoritma pengambilan teks lengkap yang canggih, dikombinasikan dengan strategi optimasi pengambilan yang efisien, untuk mendukung kecepatan pengambilan data besar-besaran tingkat milidetik dan pengambilan bersamaan multi-pengguna. Pencarian lanjutan mendukung metode pencarian yang disesuaikan untuk memenuhi berbagai kebutuhan pencarian pengguna. Mengadopsi strategi teknologi caching yang efisien untuk meningkatkan stabilitas sistem dan kapasitas beban, mengurangi beban sistem, dan data cache diperbarui secara otomatis sesuai dengan kondisi tertentu.
Objek yang berlaku
Cocok untuk grup situs web internal atau grup situs web Internet seperti perusahaan, lembaga pemerintah, sekolah, dll. untuk membuat mesin pencari web;
Cocok untuk grup situs web di berbagai industri dan bidang untuk membangun mesin pencari web industri;
Cocok untuk grup situs web lokal seperti provinsi, kota, dan kabupaten untuk membangun mesin pencari web lokal;