ASP 수집 원리 수집 시작 분석 예시
첫 번째 단계는 캡처하려는 페이지를 분석하는 것입니다.
브라우저를 사용하여 수집하려는 페이지를 엽니다(예: http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml, 연 후 다른 페이지를 사용할 수도 있음). 소스 파일을 보려면 마우스 오른쪽 버튼을 클릭하세요.
두 번째 단계는 수집할 콘텐츠의 위치를 찾는 것입니다.
이 페이지의 제목과 콘텐츠 위치를 수집하려면 다음을 수행하세요.
제목은 <h1 id=artibodyTitle style=color:#03005C;>와 </h1> 사이에 있습니다.
내용은 <!-- 텍스트 내용 시작 -->과 <!-- 텍스트 내용 끝 --> 사이에 있습니다.
위치의 고유성에 주의를 기울이십시오. 고유한지 확인하기 위해 편집 시 검색을 사용할 수 있습니다. 그렇지 않은 경우에도 작동하지 않는 경우 시도해 보세요. , 교체만 가능합니다.
세 번째 단계는 코드를 작성하는 것입니다.
다음과 같이 코드 코드를 복사합니다.
<%
'기능: ASP 수집 코드
'저자 : 왕동
'비고: 원본 프로그램을 지원하십시오. 이 정보를 보관하십시오. 감사합니다.
url=http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml
str=getHTTPage(url)
title=strcut(str,<h1 id=artibodyTitle style=color:#03005C;>,</h1>,2)
content=strcut(str,<!-- 텍스트 내용 시작 -->,<!-- 텍스트 내용 끝 -->,2)
응답.뉴스 제목 쓰기<br><b>&제목&</b><br><br><br>뉴스 콘텐츠:<br>&콘텐츠
함수 getHTTPPage(url)
오류 발생 시 다음 재개
희미한 http
http=Server.createobject(Microsoft.XMLHTTP)를 설정합니다.
Http.open GET,URL,false
Http.send()
Http.readystate<>4이면
종료 기능
종료하면
getHTTPPage=bytesToBSTR(Http.responseBody,GB2312)
http=아무것도 설정하지 않음
Err.number<>0이면
Response.Write <p align='center'><font color='red'><b>서버에서 파일 콘텐츠를 가져오는 중 오류가 발생했습니다.</b></font></p>
Err.Clear
종료 조건
기능 종료
함수 BytesToBstr(body,Cset)
희미한 객체 스트림
set objstream = Server.CreateObject(adodb.stream)
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write 본문
objstream.위치 = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
objstream = 아무것도 설정하지 않음
기능 종료
'문자열 가로채기, 1. 시작 문자와 끝 문자 포함, 2. 제외
함수 strCut(strContent,StartStr,EndStr,CutType)
희미한 strHtml,S1,S2
strHtml = strContent
오류 발생 시 다음 재개
케이스 절단 유형 선택
사례 1
S1 = InStr(strHtml,StartStr)
S2 = InStr(S1,strHtml,EndStr)+Len(EndStr)
사례 2
S1 = InStr(strHtml,StartStr)+Len(StartStr)
S2 = InStr(S1,strHtml,EndStr)
선택 종료
오류가 발생한 경우
strcute = <p align='center'>필요한 콘텐츠를 찾을 수 없습니다. </p>
Err.Clear
종료 기능
또 다른
strCut = 중간(strHtml,S1,S2-S1)
종료 조건
기능 종료
%>
괜찮습니다. 이제 얻은 콘텐츠를 출력하겠습니다. 콘텐츠를 데이터베이스에 쓸 수 있으므로 데이터는 귀하의 것입니다.