Contoh analisis pengumpulan prinsip pengumpulan asp dimulai
Langkah pertama adalah menganalisis halaman yang ingin Anda ambil.
Gunakan browser untuk membuka halaman yang ingin Anda kumpulkan (seperti: http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml, Anda juga dapat menggunakan halaman lain). klik kanan untuk melihat file sumber.
Langkah kedua adalah mencari lokasi konten yang akan dikumpulkan.
Jika saya ingin mengumpulkan judul dan lokasi konten halaman ini:
Judulnya berada di antara <h1 id=artibodyTitle style=color:#03005C;> dan </h1>
Isinya antara <!-- Isi teks dimulai --> dan <!-- Isi teks diakhiri -->
Perhatikan keunikan lokasinya, setelah ketemu bisa menggunakan pencarian di edit untuk melihat apakah unik. Jika belum, usahakan menjadi yang pertama , Anda hanya dapat menggantinya.
Langkah ketiga adalah menulis kode
Copy kode kodenya sebagai berikut:
<%
'Fungsi: kode pengumpulan asp
'Penulis: wangsdong
'Keterangan: Mendukung program asli, harap simpan informasi ini, terima kasih
url=http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml
str=dapatkanHalaman HTTP(url)
title=strcut(str,<h1 id=artibodyTitle style=color:#03005C;>,</h1>,2)
content=strcut(str,<!-- Isi teks dimulai -->,<!-- Isi teks berakhir -->,2)
respon.tulis judul berita<br><b>&judul&</b><br><br><br>konten berita:<br>&konten
Fungsi getHTTPHalaman(url)
Pada Kesalahan Lanjutkan Berikutnya
redupkan http
atur http=Server.buat objek(Microsoft.XMLHTTP)
Http.buka GET,url,false
Http.kirim()
jika Http.readystate<>4 lalu
fungsi keluar
berakhir jika
getHTTPPage=bytesToBSTR(Http.responseBody,GB2312)
atur http=tidak ada
Jika Err.number<>0 maka
Response.Write <p align='center'><font color='red'><b>Server mengalami kesalahan dalam mendapatkan konten file</b></font></p>
Err. Jelas
Akhiri Jika
Fungsi Akhir
Fungsi BytesToBstr(tubuh,Cset)
objekstream redup
setel objstream = Server.CreateObject(adodb.stream)
objstream.Jenis = 1
objstream.Mode =3
objstream.Buka
objstream.Tulis isi
objstream.Posisi = 0
objstream.Jenis = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Tutup
setel objstream = tidak ada
Fungsi Akhir
'Mencegat string, 1. termasuk karakter awal dan akhir, 2. tidak termasuk
Fungsi strCut(strContent,StartStr,EndStr,CutType)
Redupkan strHtml,S1,S2
strHtml = strKonten
Pada Kesalahan Lanjutkan Berikutnya
Pilih Tipe Potongan Kasus
Kasus 1
S1 = InStr(strHtml,MulaiStr)
S2 = InStr(S1,strHtml,EndStr)+Len(EndStr)
Kasus 2
S1 = InStr(strHtml,StartStr)+Len(StartStr)
S2 = InStr(S1,strHtml,EndStr)
Pilihan Akhir
Jika Salah Lalu
strCute = <p align='center'>Konten yang diperlukan tidak ditemukan. </p>
Err. Jelas
Fungsi Keluar
Kalau tidak
strCut = Pertengahan(strHtml,S1,S2-S1)
Akhiri Jika
Fungsi Akhir
%>
Tidak apa-apa, saya akan menampilkan konten yang diperoleh sekarang, dan Anda dapat menulis konten tersebut ke dalam database, sehingga data menjadi milik Anda.