jsoup
jsoup-1.18.3
jsoup是一個 Java 函式庫,可以輕鬆使用現實世界的 HTML 和 XML。它提供了一個易於使用的 API,用於使用 DOM API 方法、CSS 和 xpath 選擇器進行 URL 獲取、資料解析、提取和操作。
jsoup實作了 WHATWG HTML5 規範,並將 HTML 解析為與現代瀏覽器相同的 DOM。
jsoup 旨在處理各種常見的 HTML;從原始和驗證,到無效的標籤湯; jsoup 將建立一個合理的解析樹。
請造訪jsoup.org以取得下載和完整的 API 文件。
取得 Wikipedia 主頁,將其解析為 DOM,然後從In the News部分選擇標題到元素清單中:
Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
log ( "%s n t %s" ,
headline . attr ( "title" ), headline . absUrl ( "href" ));
}
線上範例,完整原始碼。
jsoup 是一個根據 MIT 自由許可證分發的開源專案。原始碼可在 GitHub 上取得。
在Android專案中使用時,應啟用NIO規格的核心庫脫糖以支援Java 8+功能。
如果您對如何使用 jsoup 有任何疑問,或者對未來的開發有想法,請透過 jsoup 討論與我們聯繫。
如果您發現任何問題,請在檢查重複項後提交錯誤。
版權頁講述了建構 jsoup 的歷史和使用的工具。
jsoup 是一般的穩定版本。