Как использовать рептилии для захвата контента веб -сайта веб -страницы.

Автор：Eve Cole Время обновления：2025-02-14 22:24:02

Пример этой статьи показывает метод использования Java для использования рептилий для захвата контента веб -страницы веб -сайта. Поделитесь этим для всех для вашей ссылки. Специфика заключается в следующем:

Недавно я использовал Java для изучения технологии восхождения на восхождение. Другой сами по себе принадлежит Java.

Код заключается в следующем:

 // Первый метод // Этот метод предназначен для использования пакета, предоставленного Apache, простой и удобной //, но используются следующие пакеты: Commons-codec -.4.jar // commons-httpclient-3.1.jar //// Commons -Logging -1.0.4 {// if (param! = Null) // Keyword = new String (param.getBytes ("gb2312"), "iso-8859-1"); -Generatd Catch Block // e1.printstacktrace (); SetRequestbody (Data); Вы можете отменить вход и изучение. "); // Удалить метку System.out.println (p) с HTML -языком в веб -странице;} Catch (Exception e) {e.printStackTrace ();} return response;} // Второй метод // Этот метод Является ли собственный URL -адрес java для захвата контента веб -сайта GetPageContent (String Strurl, String StrpoStrequest, Int MaxLength) {// ingbuffer (); SetProperty ("sun.net.client.defaultreadtieout", "5000"); Length ()> 0) {hconnect.setDoOutput (true); Содержание BufferedReader RD = New BufferedReader H; ) ch); ]*> "," "); System.out.println (s); rd.close (); hconnect.disconnect (); return buffer.tostring (). Trim ();} catch (Exception e) {// Вернуть «Ошибка: прочтет неудачу на веб -странице! "; // return null;}}

Затем напишите тестовый класс:

 Public static void main (string [] args) {string url = "//www.vevb.com"; Ключевое слово);/ первый метод // p.getPageContent (URL, "post", 100500);

Ха -ха, посмотрите на консоли, вы получаете содержание веб -страницы

Есть надежда, что эта статья полезна для дизайна программы Java каждого.