A ferramenta rastreador da web WebSpider 5.1 pode rastrear qualquer página da web na Internet e sites WAP, incluindo páginas que exigem login para acesso. Analise o conteúdo da página capturada para obter informações estruturadas, como: título da notícia, autor, fonte, texto, etc. Ele suporta rotação automática de páginas e captura de páginas de lista, suporta a fusão de várias páginas de páginas de texto, suporta a captura de imagens e arquivos e pode capturar páginas da web estáticas ou dinâmicas com parâmetros.
O usuário especifica o site a ser rastreado, o tipo de página da web a ser rastreada (página fixa, página exibida na paginação, etc.) e configura como analisar itens de dados (como título da notícia, autor, fonte, texto, etc. .). O sistema pode capturar dados automaticamente em tempo real, e o tempo para iniciar a captura também pode ser definido por meio de configuração, conseguindo realmente “captura sob demanda, uma vez configurada, captura permanente”. Os dados capturados podem ser salvos no banco de dados. Suporta bancos de dados convencionais atuais, incluindo: Oracle, SQLServer, MySQL, etc.
Esta ferramenta pode substituir completamente o modo tradicional de edição e processamento manual de informações. Ela pode fornecer às empresas as informações e inteligência mais recentes em tempo real, com precisão e 24 horas por dia, o que pode realmente reduzir custos e melhorar a competitividade das empresas.
As principais características desta ferramenta são as seguintes:
* Ampla gama de aplicativos, pode rastrear qualquer página da web (incluindo páginas da web que só podem ser acessadas após o login)
*Velocidade de processamento rápida, se a rede estiver aberta, 10.000 páginas da web podem ser rastreadas e analisadas em uma hora
*Adota tecnologia exclusiva de filtragem de dados duplicados, suporta captura incremental de dados e pode capturar dados em tempo real, como: informações de negociação de ações, previsão do tempo, etc.
*A precisão das informações capturadas é alta e o sistema fornece funções poderosas de verificação de dados para garantir a exatidão dos dados
*Suporta a continuação do rastreamento do ponto de interrupção Após uma falha ou situação anormal, o rastreamento pode ser retomado e o trabalho de rastreamento subsequente pode ser continuado, o que melhora a eficiência do rastreamento do sistema.
*Para páginas de lista, a virada de página é suportada e os dados em todas as páginas de lista podem ser capturados. Para a página de texto, o conteúdo exibido na paginação pode ser mesclado automaticamente;
* Suporta rastreamento profundo de páginas e as páginas podem ser rastreadas nível por nível. Por exemplo, rastreie o URL da página do corpo através da página de lista e, em seguida, rastreie a página do corpo. As páginas em todos os níveis podem ser armazenadas separadamente;
*Interface de operação WEB, instale-a em um só lugar e use-a em qualquer lugar
*Análise passo a passo, armazenamento passo a passo
*Configure uma vez, capture permanentemente, de uma vez por todas