Spider es un programa muy útil en Internet. Los motores de búsqueda utilizan programas spider para recopilar páginas web en bases de datos. utilizados en una computadora, los desarrolladores usan programas araña para escanear su propia Web en busca de enlaces no válidos... Los programas araña tienen diferentes usos para diferentes usuarios Entonces, ¿cómo funcionan los programas araña?
Una araña es un programa semiautomático. Así como una araña real viaja sobre su red (telaraña), un programa araña también viaja sobre la red tejida por enlaces web de manera similar. La razón por la que el programa araña es semiautomático es que siempre necesita un enlace inicial (punto de partida), pero su funcionamiento posterior lo determina él mismo. El programa araña escaneará los enlaces contenidos en la página de inicio y luego accederá a estos enlaces. para señalar páginas y luego analizar y rastrear los enlaces contenidos en esas páginas. En teoría, el programa araña eventualmente visitará todas las páginas de Internet, porque casi todas las páginas de Internet siempre hacen referencia a otras páginas más o menos.
Este artículo presenta cómo usar el lenguaje C # para construir un programa araña, que puede descargar el contenido de todo el sitio web a un directorio específico. La interfaz de ejecución del programa se muestra en la Figura 1. Puede construir fácilmente su propio programa araña utilizando varias clases básicas proporcionadas en este artículo.
Para obtener más información, lea: http://info.codepub.com/2008/03/info-18319.html
Expandir