La herramienta de rastreo web WebSpider 5.1 puede rastrear cualquier página web en Internet y sitios web WAP, incluidas las páginas que requieren iniciar sesión para acceder. Analizar el contenido de la página capturada para obtener información estructurada, como: título de la noticia, autor, fuente, texto, etc. Admite el cambio automático de páginas y la captura de páginas de lista, admite la combinación de varias páginas de páginas de texto, admite la captura de imágenes y archivos y puede capturar páginas web estáticas o páginas web dinámicas con parámetros.
El usuario especifica el sitio web que se rastreará, el tipo de página web que se rastreará (página fija, página mostrada en paginación, etc.) y configura cómo analizar los elementos de datos (como el título de la noticia, el autor, la fuente, el texto, etc.). .). El sistema puede capturar datos automáticamente en tiempo real, y el tiempo para comenzar a capturar también se puede configurar mediante la configuración, logrando realmente una "captura bajo demanda, una vez configurada, captura permanente". Los datos capturados se pueden guardar en la base de datos. Admite las principales bases de datos actuales, incluidas: Oracle, SQLServer, MySQL, etc.
Esta herramienta puede reemplazar completamente el modo tradicional de editar y procesar información manualmente. Puede proporcionar a las empresas la información e inteligencia más recientes en tiempo real, con precisión y las 24 horas del día, lo que realmente puede reducir los costos y mejorar la competitividad de las empresas.
Las principales características de esta herramienta son las siguientes:
*Amplia gama de aplicaciones, puede rastrear cualquier página web (incluidas páginas web a las que solo se puede acceder después de iniciar sesión)
*Velocidad de procesamiento rápida: si la red está abierta, se pueden rastrear y analizar 10.000 páginas web en una hora
*Adopta una tecnología única de filtrado de datos duplicados, admite la captura de datos incrementales y puede capturar datos en tiempo real, como: información sobre operaciones bursátiles, pronóstico del tiempo, etc.
*La precisión de la información capturada es alta y el sistema proporciona potentes funciones de verificación de datos para garantizar la exactitud de los datos.
*Admite la continuación del rastreo en el punto de interrupción después de un bloqueo o una situación anormal, el rastreo se puede reanudar y el trabajo de rastreo posterior puede continuar, lo que mejora la eficiencia del rastreo del sistema.
*Para las páginas de lista, se admite el paso de página y se pueden capturar datos en todas las páginas de lista. Para la página de texto, el contenido que se muestra en la paginación se puede fusionar automáticamente;
*Admite el rastreo profundo de páginas y las páginas se pueden rastrear nivel por nivel. Por ejemplo, rastree la URL de la página del cuerpo a través de la página de lista y luego rastree la página del cuerpo. Las páginas de todos los niveles se pueden almacenar por separado;
*Interfaz de operación WEB, instálela en un solo lugar y úsela en cualquier lugar
*Análisis paso a paso, almacenamiento paso a paso.
*Configurar una vez, capturar permanentemente, de una vez por todas