< %@LANGUAGE="VBSCRIPT " CODEPAGE="936"%>
<!-- #include file="conn.asp" -->
<!-- #include file="inc/function.asp" -->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" " http://www.w3.org/TR/html4/loose.dtd ">
<html>
<หัว>
<title>เอกสารที่ไม่มีชื่อ</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta http-equiv="refresh" content="300;URL=steal_house.asp">
</หัว>
<ร่างกาย>
-
เมื่อเกิดข้อผิดพลาดดำเนินการต่อต่อไป
-
เซิร์ฟเวอร์ ScriptTimeout = 999999
-
'字符编码函数
-
ฟังก์ชั่น BytesToBstr (เนื้อหา, รหัส)
objstream สลัว
ตั้ง objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.เปิด
objstream เขียนเนื้อหา
objstream ตำแหน่ง = 0
objstream.Type = 2
objstream.Charset =รหัส
BytesToBstr = objstream.ReadText
objstream.ปิด
ตั้งค่า objstream = ไม่มีเลย
สิ้นสุดฟังก์ชัน
'取行字符串在另一字符串中的出现位置
ฟังก์ชันนิวสตริง(wstr,strng)
Newstring=Instr(lcase(wstr),lcase(strng))
ถ้า Newstring<=0 แล้ว Newstring=Len(wstr)
ฟังก์ชันสิ้นสุด
'替换字符串函数
ฟังก์ชั่นแทนที่Str(ori,str1,str2)
แทนที่Str=แทนที่(ori,str1,str2)
ฟังก์ชั่นสิ้นสุด
-
ฟังก์ชั่น ReadXml (url, รหัส, เริ่มต้น, สิ้นสุด)
ตั้งค่า oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.ส่ง()
ReadXml=BytesToBstr(oSend.responseBody,รหัส )
start=Instr(ReadXml,เริ่มต้น)
ReadXml=mid(ReadXml เริ่มต้น)
สิ้นสุด = Instr (ReadXml สิ้นสุด)
ReadXml=ซ้าย(ReadXml สิ้นสุด-1)
ฟังก์ชันสิ้นสุด
ฟังก์ชัน SubStr(body,start,ends)
start=Instr(เนื้อหา,เริ่มต้น)
SubStr=mid(body,start+len(start)+1)
สิ้นสุด = Instr (SubStr สิ้นสุด)
SubStr=ซ้าย(SubStr,สิ้นสุด-1)
ฟังก์ชั่นสิ้นสุด
dim getcont, NewsContent
URL สลัว, ชื่อเรื่อง
url=" http://www.***.com"'新闻网址knowsky.com
getcont=ReadXml(url,"gb2312","<table class=k2 border=""0""","</table>")
getcont=RegexHtml(getcont)
dim KeyId,NewsClass,เมือง,ตำแหน่ง,ประเภทบ้าน,ระดับ,พื้นที่,ราคา,Demostra
dim ContactMan,ติดต่อ
สำหรับ i=2 ถึง ubound(getcont)
การตอบสนองเขียน(getcont(i)&"__<br>")
tempLink=mid(getcont(i),instr(getcont(i),"href=""")+6,instr(getcont(i),""" onClick")-10)
tempLink=replace(tempLink,"../","")
response.Write(i"&tempLink&"<br>")
NewsContent=ReadXml(tempLink,"gb2312","<td valign=""bottom"" width=""400"">","<hr width=""760"" noshade size=""1"" color= ""#808080""> ")
NewsContent=RemoveHtml(เนื้อหาข่าว)
NewsContent=replace(เนื้อหาข่าว,VbCrLf,"")
NewsContent=replace(เนื้อหาข่าว,vbNewLine,"")
NewsContent=replace(เนื้อหาข่าว," ","")
NewsContent=replace(เนื้อหาข่าว," ","")
NewsContent=replace(เนื้อหาข่าว," ","")
NewsContent=replace(เนื้อหาข่าว,"n", "")
NewsContent=replace(เนื้อหาข่าว,chr(10),"")
NewsContent=replace(เนื้อหาข่าว,chr(13),"")
'================ รับเนื้อหา=======================
ตอบกลับเขียน(เนื้อหาข่าว)
KeyId=SubStr(เนื้อหาข่าว,"列号:", "信息类别:")
NewsClass=SubStr(เนื้อหาข่าว,"类别:","所在城市:")
City=SubStr(NewsContent,"城市:","房屋具体位置:")
Position=SubStr(NewsContent,"位置:","房屋类型:")
HouseType=SubStr(เนื้อหาข่าว,"类型:","楼层:")
Level=SubStr(NewsContent,"楼层:"," 使用的积:")
Area=SubStr(NewsContent,"เลดี้积:","房价:")
Price=SubStr(NewsContent,"房价:","其他说明:")
Demostra=SubStr(เนื้อหาข่าว,"说明:"," 联系人:")
ContactMan=SubStr(เนื้อหาข่าว,"联系人:", "联系方式:")
Contact=SubStr(NewsContent,"联系方式:","信息来源:")
response.Write("总序列号:"&KeyId&"<br>")
response.Write("信息类别:"&NewsClass&"<br>")
response.Write("所在城市:"&City&"<br>")
response.Write("房屋具体位置:"&Position&"<br>")
response.Write("房屋类型:"&HouseType&"<br>")
response.Write("楼层:"&ระดับ&"<br>")
response.Write("使用เลดี้积:"&Area&"<br>")
response.Write("房价:"&Price&"<br>")
response.Write("其他说明:"&Demostra&"<br>")
response.Write("联系人:"&ContactMan&"<br>")
response.Write("联系方式:"&ติดต่อ&"<br>")
'title=RemoveHTML(aa(i))
'response.Write("หัวข้อ:"&หัวข้อ)
สำหรับ n=0 ถึง application.Contents.count
if(application.Contents(n)=KeyId) แล้ว
ifexit=จริง
สิ้นสุดถ้า
ต่อไป
ถ้าไม่ ifexit แล้ว
แอปพลิเคชัน (เวลา & i) = KeyId
'添加到数据库
-
ตั้งค่า rs=server.CreateObject("adodb.recordset")
rs.open "เลือก 1 อันดับแรก * จากข่าวสาร เรียงตาม id desc",conn,3,3
rs.เพิ่มใหม่
rs("NewsClass")=นิวส์คลาส
rs("เมือง")=เมือง
rs("ตำแหน่ง")=ตำแหน่ง
rs("ประเภทบ้าน")=ประเภทบ้าน
rs("ระดับ")=ระดับ
rs("พื้นที่")=พื้นที่
rs("ราคา")=ราคา
rs("เดโมสตรา")=เดโมสตรา
rs("ContactMan")=ผู้ติดต่อ
rs("ติดต่อ")=ติดต่อ
อาร์เอสอัปเดต
฿.ปิด
ตั้งค่า rs=nothing
สิ้นสุดถ้า
-
ต่อไป
ฟังก์ชั่น RemoveTag(body)
ตั้ง regEx = RegExp ใหม่
regEx.Pattern = "<[a].*?</[a]>"
regEx.IgnoreCase = จริง
regEx.Global = จริง
ตั้งค่าการจับคู่ = regEx.Execute(body)
สลัวฉัน, arr (15), ifexit
ผม=0
เจ=0
สำหรับการแข่งขันแต่ละครั้งในการแข่งขัน
TempStr = Match.Value
TempStr=replace(TempStr,"<td>", "")
TempStr=replace(TempStr,"</td>", "")
TempStr=replace(TempStr,"<tr>", "")
TempStr=replace(TempStr,"</tr>", "")
arr(i)=TempStr
ฉัน=ฉัน+1
ถ้า(i>=15) แล้ว
ออกเพื่อ
สิ้นสุดถ้า
ต่อไป
ตั้งค่า regEx=nothing
ตั้งค่าการจับคู่ = ไม่มีเลย
RemoveTag=arr
ฟังก์ชั่นสิ้นสุด
ฟังก์ชั่น RegexHtml (เนื้อหา)
สลัว r_arr (47), r_temp
ตั้งค่า regEx2 = RegExp ใหม่
regEx2.Pattern ="<a.*?</a>"
regEx2.IgnoreCase = จริง
regEx2.Global = จริง
ตั้งค่า Matches2 = regEx2.Execute (เนื้อหา)
iii=0
สำหรับแต่ละแมตช์ในแมตช์2
r_arr(iii)=Match.Value
iii=iii+1
ต่อไป
RegexHtml=r_arr
ตั้งค่า regEx2=ไม่มีอะไร
ตั้งค่า Matches2=ไม่มีอะไร
ฟังก์ชั่นสิ้นสุด
'=================================================' =====
conn.ปิด
ตั้งค่า conn=ไม่มีอะไร
-
</ร่างกาย>
</html>
function.asp
<%
-
'函数名:gotTopic
作 用:截字符串,汉字一个算两个字符,英文算一个字符
'参 数:str ----原字符串
' strlen ----截取长度
返回值:截取后的字符串
-
ฟังก์ชั่น gotTopic (str, strlen)
ถ้า str="" แล้ว
ได้หัวข้อ = ""
ฟังก์ชั่นทางออก
สิ้นสุดถ้า
สลัว l,t,c, i
str=แทนที่(แทนที่(แทนที่(แทนที่(str," "," "),""",chr(34)),">",">"),"<","<" )
str=แทนที่(str,"?","")
l=เลน(str)
เสื้อ=0
สำหรับ i=1 ถึง l
c=Abs(Asc(กลาง(str,i,1)))
ถ้า c>255 แล้ว
เสื้อ=t+2
อื่น
เสื้อ=t+1
สิ้นสุดถ้า
ถ้า t>=strlen แล้ว
gotTopic=left(str,i) & "…"
ออกเพื่อ
อื่น
gotTopic=str
สิ้นสุดถ้า
ต่อไป
gotTopic=replace(replace(replace(replace(gotTopic," "," "),chr(34),"""),">",">"),"<","<" )
ฟังก์ชั่นสิ้นสุด
-
'ลบ:RemoveHTML(strHTML)
'功能:去除HTML标记
'参数:strHTML --要去除HTML标记的字符串
-
ฟังก์ชั่น RemoveHTML(strHTML)
Dim objRegExp, แมตช์, แมตช์
ตั้งค่า objRegExp = Regexp ใหม่
objRegExp.IgnoreCase = True
objRegExp.Global = จริง
'取闭合的<>
objRegExp.Pattern = "<.+?>"
进行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍历匹配集合,并替换掉匹配的项目
สำหรับการแข่งขันแต่ละครั้งในการแข่งขัน
strHtml=แทนที่(strHTML,Match.Value,"")
ต่อไป
RemoveHTML=strHTML
ตั้งค่า objRegExp = ไม่มีเลย
ตั้งค่าการจับคู่=ไม่มีอะไร
สิ้นสุดฟังก์ชัน
%>
conn.asp
<%
'เมื่อเกิดข้อผิดพลาดให้ดำเนินการต่อต่อไป
ตั้งค่า conn=server.CreateObject("adodb.connection")
con= "driver={ไดรเวอร์ Microsoft Access (*.mdb)};dbq=" & Server.MapPath("stest.mdb")
conn.open con
ย่อย consclose
เชื่อมต่อปิด
ตั้งค่า conn=ไม่มีอะไร
จบย่อย
-
附:抓取信息的详细页เลดี้事例
总序列号: | 479280 |
信息类别: | 出租 |
所在城市: | 济南 |
房屋具体位置: | 华龙路华信路交界口 |
房屋类型: | 其他 |
楼层: | 六层 |
使用的积: | 24~240 平方米之间 |
房价: | 0 [租赁:元/月,买卖:万元/套] |
其他说明: | 华信商务楼3至6层小空间对外出租(0.5元/平起),本楼属纯商务办公投资使用,可用于办公写字间,周边设施齐全、交通便利(37、80、K95在本楼前经过),全产权、市证,楼内设施包括水、电、暖、电梯设施齐全,มี意者可电讯! |
联系人: | 鲁、王 |
联系方式: | 88017966、86812217 |
信息来源: | 2005-8-4 8:28:55 来自:218.98.86.175 |
点击次数: | 19 |