Beispielanalyse für den Beginn der Asp-Sammlungsprinzipiensammlung
Der erste Schritt besteht darin, die Seiten zu analysieren, die Sie erfassen möchten.
Verwenden Sie einen Browser, um die Seite zu öffnen, die Sie sammeln möchten (z. B. http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml, Sie können nach dem Öffnen auch andere Seiten verwenden). Klicken Sie mit der rechten Maustaste, um die Quelldatei anzuzeigen.
Der zweite Schritt besteht darin, den Speicherort der zu sammelnden Inhalte zu ermitteln.
Wenn ich den Titel und den Inhaltsort dieser Seite erfassen möchte:
Der Titel liegt zwischen <h1 id=artibodyTitle style=color:#03005C;> und </h1>
Der Inhalt liegt zwischen <!-- Textinhalt Anfang --> und <!-- Textinhalt Ende -->
Achten Sie auf die Einzigartigkeit des Standorts, indem Sie die Suche verwenden, um festzustellen, ob er eindeutig ist. Wenn nicht, versuchen Sie, der Erste zu sein , Sie können es nur ersetzen.
Der dritte Schritt besteht darin, Code zu schreiben
Kopieren Sie den Codecode wie folgt:
<%
'Funktion: ASP-Sammlungscode
'Autor: wangsdong
'Bemerkungen: Unterstützen Sie Originalprogramme. Bitte bewahren Sie diese Informationen auf. Vielen Dank
url=http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml
str=getHTTPage(url)
title=strcut(str,<h1 id=artibodyTitle style=color:#03005C;>,</h1>,2)
content=strcut(str,<!-- Textinhalt beginnt -->,<!-- Textinhalt endet -->,2)
Antwort.Nachrichtentitel schreiben<br><b>&title&</b><br><br><br>Nachrichteninhalt:<br>&content
Funktion getHTTPPage(url)
Bei Fehler Weiter fortsetzen
dimmen Sie http
set http=Server.createobject(Microsoft.XMLHTTP)
Http.open GET,url,false
Http.send()
wenn Http.readystate<>4 dann
Exit-Funktion
Ende wenn
getHTTPPage=bytesToBSTR(Http.responseBody,GB2312)
setze http=nichts
Wenn Err.number<>0 dann
Response.Write <p align='center'><font color='red'><b>Der Server hat einen Fehler beim Abrufen des Dateiinhalts</b></font></p>
Fehler.Klar
Ende wenn
Funktion beenden
Funktion BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject(adodb.stream)
objstream.Type = 1
objstream.Mode =3
objstream.Öffnen
objstream.Text schreiben
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Schließen
set objstream = nichts
Funktion beenden
'Fängt die Zeichenfolge ab, 1. einschließlich der Anfangs- und Endzeichen, 2. ohne
Funktion strCut(strContent,StartStr,EndStr,CutType)
Dimmen Sie strHtml,S1,S2
strHtml = strContent
Bei Fehler Weiter fortsetzen
Wählen Sie Case CutType aus
Fall 1
S1 = InStr(strHtml,StartStr)
S2 = InStr(S1,strHtml,EndStr)+Len(EndStr)
Fall 2
S1 = InStr(strHtml,StartStr)+Len(StartStr)
S2 = InStr(S1,strHtml,EndStr)
Endauswahl
Wenn Sie sich irren, dann
strCute = <p align='center'>Der erforderliche Inhalt wurde nicht gefunden. </p>
Fehler.Klar
Exit-Funktion
Anders
strCut = Mid(strHtml,S1,S2-S1)
Ende wenn
Funktion beenden
%>
Das ist in Ordnung, ich werde den erhaltenen Inhalt jetzt ausgeben und Sie können den Inhalt in die Datenbank schreiben, sodass die Daten Ihnen gehören.