Análisis de ejemplo del inicio de la colección del principio de colección asp
El primer paso es analizar las páginas que desea capturar.
Utilice un navegador para abrir la página que desea recopilar (como: http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml, también puede utilizar otras páginas después de abrir). haga clic derecho para ver el archivo fuente.
El segundo paso es encontrar la ubicación del contenido que se va a recopilar.
Si quiero recopilar el título y la ubicación del contenido de esta página:
El título está entre <h1 id=artibodyTitle style=color:#03005C;> y </h1>
El contenido está entre <!-- Inicio del contenido del texto --> y <!-- Fin del contenido del texto -->
Preste atención a la singularidad de la ubicación. Después de encontrarla, puede utilizar la búsqueda en la edición para ver si es única. Si no, intente ser el primero. , sólo puedes reemplazarlo.
El tercer paso es escribir código.
Copie el código de código de la siguiente manera:
<%
'Función: código de colección asp
'Autor: Wangsdong
'Observaciones: Admite programas originales, conserve esta información, gracias
URL = http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml
str=getHTTPage(url)
título=strcut(cadena,<h1 id=artibodyTitle estilo=color:#03005C;>,</h1>,2)
content=strcut(str,<!-- Comienzo del contenido del texto -->,<!-- Fin del contenido del texto -->,2)
respuesta.escribir título de la noticia<br><b>&título&</b><br><br><br>contenido de la noticia:<br>&contenido
Función getHTTPPage(url)
En caso de error Continuar siguiente
http oscuro
establecer http=Servidor.createobject(Microsoft.XMLHTTP)
Http.open OBTENER,url,falso
http.enviar()
si Http.readystate<>4 entonces
función de salida
terminar si
getHTTPPage=bytesToBSTR(Http.responseBody,GB2312)
establecer http=nada
Si número de error<>0 entonces
Response.Write <p align='center'><font color='red'><b>El servidor tiene un error al obtener el contenido del archivo</b></font></p>
Err.Borrar
Terminar si
Función final
Función BytesToBstr(cuerpo,Cset)
corriente de objetos tenue
establecer objstream = Server.CreateObject(adodb.stream)
objstream.Tipo = 1
objstream.Modo =3
objstream.Abrir
objstream.Escribir cuerpo
objstream.Posición = 0
objstream.Tipo = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Cerrar
establecer objstream = nada
Función final
'Intercepta la cadena, 1. incluyendo los caracteres inicial y final, 2. excluyendo
Función strCut(strContent,StartStr,EndStr,CutType)
Dim strHtml,S1,S2
strHtml = strContenido
En caso de error Continuar siguiente
Seleccione el tipo de corte de caja
Caso 1
S1 = InStr(strHtml,InicioStr)
S2 = InStr(S1,strHtml,EndStr)+Len(EndStr)
Caso 2
S1 = InStr(strHtml,InicioStr)+Len(InicioStr)
S2 = InStr(S1,strHtml,EndStr)
Seleccionar fin
Si se equivoca entonces
strCute = <p align='center'>No se encontró el contenido requerido. </p>
Err.Borrar
Función de salida
Demás
strCut = Medio(strHtml,S1,S2-S1)
Terminar si
Función final
%>
Eso es todo. Ahora generaré el contenido obtenido y usted podrá escribir el contenido en la base de datos para que los datos sean suyos.