Em resposta às opiniões da maioria dos usuários, melhoramos este produto e lançamos uma "Edição Pessoal" para uso gratuito, permitindo que você experimente melhor o produto.
A V1.1 foi aprimorada para incluir classificações de pesquisa, códigos de pesquisa, gerenciamento de diretório de índice, configurações de peso de página da web e outras funções para melhorar a recuperação e aumentar a velocidade de pesquisa.
Introdução do sistema
K-PageSearch é um mecanismo de pesquisa na web desenvolvido de forma independente pela Kwindsoft em 2007 e projetado especificamente para recuperação de informações especializadas e industriais. Principais recursos funcionais: web spider, coleta direcional, extração de texto, segmentação de palavras chinesas, índice de texto completo, classificação de relevância, instantâneo de página da web, pesquisa relacionada, classificação de lances usa o Microsoft SQL Server e o design do sistema de pesquisa estática usa; Pesquisa de cache de ilha de dados XML Como resultado, a estabilidade e o desempenho do sistema são melhorados, os recursos do servidor são economizados e a carga do sistema é reduzida.
teia de aranha
O componente K-wind spider inclui três módulos funcionais principais: coleta de links, análise de páginas da web e verificação de páginas da web inválidas;
Identifique automaticamente codificações de páginas da web, como GB2312, BIG5, UTF-8 e Unicode;
A verificação do tipo de arquivo evita a coleta de arquivos de tipo não textual;
O K-wind spider pode coletar dados dinâmicos de páginas da web, como ASP, PHP, JSP, etc. e páginas da web estáticas, como HTML, SHTML, XHTML, etc.;
Suporta a função de retomada de coleta. Se a coleta for encerrada devido a falhas no sistema, na rede, etc., o sistema solicitará se você deseja "continuar a coleta" ou "encerrar a tarefa" ao iniciar a coleta na próxima vez;
A função de gerenciamento de tarefas de coleta pode configurar várias tarefas de coleta para agendar o trabalho, e cada tarefa de coleta será executada em sequência;
Coleta direcional
Especificar a coleção de páginas da web específicas e coletar informações especializadas em páginas da web é uma tecnologia chave para os mecanismos de pesquisa verticais melhorarem a qualidade e a relevância do conteúdo.
O link contém palavras-chave: palavras-chave que devem ser incluídas no link, por exemplo: download|mp3|soft você pode usar "|" para separar várias palavras-chave;
Palavras-chave excluídas do link: palavras-chave não incluídas no link, por exemplo: download|mp3|soft você pode usar "|" para separar várias palavras-chave excluídas;
A página da web contém palavras-chave: palavras-chave que devem ser incluídas na página da web, por exemplo: K style | search;
Palavras-chave excluídas da página da Web: palavras-chave não incluídas na página da Web, por exemplo: estilo K | pesquisa da página da Web, você pode usar "|";
Extração de texto
O componente de extração de texto desenvolvido de forma independente pela Kwindsoft é usado para extrair o conteúdo do tema central de uma página web e filtrar informações não relacionadas ao tema da página web (publicidade, navegação, colunas e outras informações de conteúdo de texto que não sejam da página web). Essa tecnologia garante efetivamente a qualidade da coleta de informações das páginas da web, melhora a relevância da recuperação, identifica e extrai com precisão o texto das páginas da web, e a precisão da extração e identificação do conteúdo das páginas da web chega a mais de 80%.
Segmentação de palavras chinesas
O componente de segmentação de palavras chinesas desenvolvido de forma independente pela Kwindsoft pode reconhecer palavras chinesas e inglesas. Com função especial de filtragem de símbolos.
Texto original de demonstração do efeito de segmentação de palavras: Kwindsoft Search World! K-PageSearch★ Um mecanismo de busca na web projetado especificamente para a indústria e recuperação de informações especializadas. Principais recursos funcionais: web spider, coleta direcional, extração de texto, segmentação de palavras chinesas, índice de texto completo, classificação de relevância, instantâneo de página da web, pesquisa relacionada, classificação de lances, banco de dados de fundo usa Microsoft SQL Server, design de sistema de pesquisa estática Use dados XML; ilha para armazenar em cache os resultados da pesquisa para melhorar a estabilidade e o desempenho do sistema, economizar recursos do servidor e reduzir a carga do sistema.
Segmentação de palavras: Kwindsoft Search World KPageSearch é um mecanismo de pesquisa na web projetado especificamente para recuperação de informações específicas do setor. Principais funções e recursos: coleta direcional de web spiders, extração de texto, segmentação de palavras chinesas, indexação de texto completo, classificação de relevância, instantâneos da web, relacionados. pesquisas, classificações de lances, banco de dados de segundo plano usando o sistema de pesquisa estática do Microsoft SQL Server Projetado para usar ilhas de dados XML para armazenar em cache os resultados da pesquisa para melhorar a estabilidade e o desempenho do sistema, economizar recursos do servidor e reduzir a carga do sistema
Índice de texto completo
A indexação de texto completo é uma das principais tecnologias dos mecanismos de pesquisa atuais. Este sistema usa o mecanismo de texto completo do Microsoft SQL Server. A indexação de texto completo permite uma recuperação rápida e poderosa, indexando cada palavra em um banco de dados especificado.
Classificação de relevância
O sistema determina a classificação dos resultados com base em cálculos de relevância e classifica com base no peso das palavras-chave e na frequência de ocorrência para tornar os resultados da pesquisa mais precisos.
Instantâneo da página da web
O que devo fazer se um resultado de pesquisa não abrir ou abrir lentamente? "Web Snapshot" pode ajudá-lo a resolver o problema. Os instantâneos da página da Web são armazenados no servidor em formato de texto. Se a página da Web original tiver sido modificada, excluída ou bloqueada, também podemos usar a função "instantâneo da página da Web" para navegar pelo conteúdo da página da Web original. Os instantâneos de páginas da Web requerem uma grande quantidade de espaço de armazenamento. Você pode definir a função de instantâneo de páginas da Web para ser ativada ou desativada. Quando desligada, o sistema não salvará os instantâneos de páginas da Web.
Pesquisas relacionadas
As pesquisas relacionadas referem-se a palavras-chave semelhantes e semelhantes às palavras-chave de pesquisa. Essas palavras-chave de pesquisa relacionadas são calculadas com base nos registros de palavras-chave usados por todos os usuários no passado. Quando as palavras-chave pesquisadas pelo usuário atenderem às condições, o sistema irá registrá-las automaticamente e fazer estatísticas. Você pode clicar em “Mais pesquisas relacionadas” para visualizar as estatísticas de pesquisa das palavras-chave. As pesquisas relacionadas ajudam você a encontrar resultados mais valiosos com mais rapidez.
PPC
Um sistema de classificação de lances profissional conveniente e prático que pode licitar e classificar as classificações do site, recomendações do lado direito e informações de clique eletrônico enviadas pelos membros. informações em uma parada. Modelo de cobrança razoável, o mesmo cliente IP clica nas mesmas informações de lance várias vezes no mesmo dia e é cobrado apenas uma vez. O sistema pode definir a recarga mínima e o consumo de cliques de IP, e os membros podem recarregar suas contas online em tempo real por conta própria ou o administrador do sistema pode fazer isso em seu nome.
Interface do software (clique na imagem para ver uma imagem maior):