jsoup เป็นไลบรารี Java ที่ทำให้ง่ายต่อการทำงานกับ HTML และ XML ในโลกแห่งความเป็นจริง มี API ที่ใช้งานง่ายสำหรับการดึง URL การแยกวิเคราะห์ข้อมูล การแยก และการจัดการโดยใช้วิธี DOM API, CSS และตัวเลือก xpath
jsoup ใช้ข้อกำหนด WHATWG HTML5 และแยกวิเคราะห์ HTML เป็น DOM เดียวกันกับเบราว์เซอร์สมัยใหม่
jsoup ได้รับการออกแบบมาเพื่อจัดการกับ HTML ทุกรูปแบบที่พบในป่า จากความเก่าแก่และการตรวจสอบไปจนถึงซุปแท็กที่ไม่ถูกต้อง jsoup จะสร้างแผนผังการแยกวิเคราะห์ที่สมเหตุสมผล
ดู jsoup.org สำหรับการดาวน์โหลดและเอกสาร API ฉบับเต็ม
ดึงข้อมูลหน้าแรกของ Wikipedia แยกวิเคราะห์เป็น DOM และเลือกหัวข้อข่าวจากส่วน In the News ลงในรายการองค์ประกอบ:
Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
log ( "%s n t %s" ,
headline . attr ( "title" ), headline . absUrl ( "href" ));
}
ตัวอย่างออนไลน์แหล่งที่มาเต็ม
jsoup เป็นโครงการโอเพ่นซอร์สที่เผยแพร่ภายใต้ใบอนุญาต MIT แบบเสรีนิยม ซอร์สโค้ดมีอยู่ใน GitHub
เมื่อใช้ในโครงการ Android ควรเปิดใช้งานไลบรารีหลักที่มีข้อกำหนด NIO เพื่อรองรับฟีเจอร์ Java 8+
หากคุณมีคำถามใดๆ เกี่ยวกับวิธีใช้ jsoup หรือมีแนวคิดสำหรับการพัฒนาในอนาคต โปรดติดต่อผ่านการสนทนาของ jsoup
หากคุณพบปัญหาใดๆ โปรดแจ้งข้อบกพร่องหลังจากตรวจสอบรายการซ้ำแล้ว
colophon พูดถึงประวัติและเครื่องมือที่ใช้สร้าง jsoup
โดยทั่วไปแล้ว jsoup นั้นมีความเสถียร