ASP収集原理収集開始の分析例
最初のステップは、キャプチャするページを分析することです。
ブラウザを使用して、収集したいページを開きます (http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml など)。開いた後、他のページを使用することもできます。右クリックしてソース ファイルを表示します。
2 番目のステップは、収集するコンテンツの場所を見つけることです。
このページのタイトルとコンテンツの場所を収集したい場合:
タイトルは <h1 id=artibodyTitle style=color:#03005C;> と </h1> の間にあります。
コンテンツは、<!-- テキストコンテンツ開始 --> と <!-- テキストコンテンツ終了 --> の間にあります。
場所を見つけたら、編集時に検索を使用して、それがユニークであるかどうかを確認してください。そうでない場合は、最初の場所になるようにしてください。 、交換するしかありません。
3 番目のステップはコードを書くことです
次のようにコードをコピーします。
<%
'関数: ASP コレクション コード
'作者: 王東
備考: オリジナルのプログラムをサポートしています。この情報は保管してください、ありがとう
url=http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml
str=getHTTPage(url)
title=strcut(str,<h1 id=artibodyTitle style=color:#03005C;>,</h1>,2)
content=strcut(str,<!-- テキストコンテンツの開始 -->,<!-- テキストコンテンツの終了 -->,2)
response.write ニュース タイトル<br><b>&title&</b><br><br><br>ニュース コンテンツ:<br>&content
関数 getHTTPPage(url)
エラー時は次へ再開
薄暗いhttp
set http=Server.createobject(Microsoft.XMLHTTP)
Http.open GET,url,false
Http.send()
if Http.readystate<>4 then
終了関数
終了する場合
getHTTPPage=bytesToBSTR(Http.responseBody,GB2312)
http=何も設定しない
Err.number<>0 の場合
Response.Write <p align='center'><font color='red'><b>サーバーでファイル コンテンツの取得中にエラーが発生しました</b></font></p>
エラークリア
終了の場合
終了機能
関数 BytesToBstr(body,Cset)
薄暗いオブジェクトストリーム
set objstream = Server.CreateObject(adodb.stream)
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.本体の書き込み
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
objstream = 何も設定しない
終了機能
'文字列をインターセプトします。1. 開始文字と終了文字を含み、2. を除外します。
関数 strCut(strContent,StartStr,EndStr,CutType)
ディム strHtml、S1、S2
strHtml = strContent
エラー時は次へ再開
ケースカットタイプを選択してください
ケース1
S1 = InStr(strHtml,StartStr)
S2 = InStr(S1,strHtml,EndStr)+Len(EndStr)
ケース2
S1 = InStr(strHtml,StartStr)+Len(StartStr)
S2 = InStr(S1,strHtml,EndStr)
エンドセレクト
エラーの場合はその後
strCute = <p align='center'>必要なコンテンツが見つかりませんでした。 </p>
エラークリア
終了関数
それ以外
strCut = Mid(strHtml,S1,S2-S1)
終了の場合
終了機能
%>
これで、取得したコンテンツを出力します。そのコンテンツをデータベースに書き込んで、データを自分のものにすることができます。