Contoh dalam artikel ini menjelaskan metode implementasi perayapan halaman web sederhana di Java. Bagikan dengan semua orang untuk referensi Anda. Analisis spesifiknya adalah sebagai berikut:
Pengenalan latar belakang
Pengantar tcp
1 tcp merealisasikan transmisi point-to-point dalam jaringan
2 Transmisi melalui port dan soket
Port menyediakan berbagai jenis transmisi (misalnya, port http adalah 80)
1) Soket dapat diikat ke port tertentu dan menyediakan fungsi transmisi
2) Satu port dapat terhubung ke beberapa soket
2. Pengenalan URL
URL adalah representasi ringkas dari lokasi dan metode akses sumber daya yang dapat diperoleh dari Internet. URL adalah alamat sumber daya standar di Internet.
Setiap file di Internet memiliki URL unik, yang berisi informasi yang menunjukkan lokasi file dan apa yang harus dilakukan browser terhadap file tersebut.
Singkatnya, yang ingin kita jelajahi konten halaman web pada dasarnya adalah merayapi konten halaman web melalui URL.
Java menyediakan dua metode:
Salah satunya adalah membaca halaman web langsung dari URL-nya
Salah satunya adalah membaca halaman web melalui URLConnection
Diantaranya, URLConnection adalah kelas dengan http sebagai intinya dan menyediakan banyak fungsi untuk menghubungkan ke http.
Artikel ini akan memberikan contoh kode berdasarkan URLConnection.
Sebelum itu, mari kita lihat pengecualian tentang url. Jika Anda tidak memahami mekanisme pengecualian Java, silakan lihat postingan blog sebelumnya.
Pengecualian MalformedURLException terjadi saat membuat URL: string url kosong atau protokol tidak dapat dikenali
Ketentuan pengecualian IOException saat membuat URLConnection: openConnection gagal. Perhatikan bahwa kode belum terhubung ke remote selama openConnection, tetapi hanya bersiap untuk terhubung ke remote.
Singkatnya, kode terakhirnya adalah sebagai berikut:
Salin kode sebagai berikut: import java.io.BufferedReader;
impor java.io.IOException;
impor java.io.InputStreamReader;
impor java.net.HttpURLConnection;
impor java.net.MalformedURLException;
impor java.net.URL;
impor java.net.URLConnection;
kelas publik SimpleNetSpider {
public static void main(String[] args) {
mencoba{
URL u = URL baru("http://docs.Oracle.com/javase/tutorial/networking/urls/");
Koneksi URLConnection = u.openConnection();
HttpURLConnection htCon = koneksi (HttpURLConnection);
int kode = htCon.getResponseCode();
if (kode == HttpURLConnection.HTTP_OK)
{
System.out.println("temukan situs webnya");
BufferedReader di=BufferedReader baru(InputStreamReader baru(htCon.getInputStream()));
String masukanBaris;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
melampirkan();
}
kalau tidak
{
System.out.println("Tidak dapat mengakses website");
}
}
tangkapan(MalformedURLException e)
{
System.out.println("URL Salah");
}
menangkap(IOException e)
{
System.out.println("Tidak dapat terhubung");
}
}
}
Saya harap artikel ini bermanfaat untuk pemrograman Java semua orang.