jsoupは、実際の HTML および XML を簡単に操作できるようにする Java ライブラリです。 DOM API メソッド、CSS、および xpath セレクターを使用した、URL のフェッチ、データ解析、抽出、および操作のための使いやすい API を提供します。
jsoup はWHATWG HTML5 仕様を実装し、HTML を最新のブラウザと同じ DOM に解析します。
jsoup は、世の中に存在するあらゆる種類の HTML を処理できるように設計されています。初期状態から検証中のものまで、無効なタグスープまで。 jsoup は賢明な解析ツリーを作成します。
ダウンロードと完全な API ドキュメントについては、 jsoup.org を参照してください。
Wikipedia のホームページを取得して DOM に解析し、 In the Newsセクションから見出しを選択して要素のリストに追加します。
Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
log ( "%s n t %s" ,
headline . attr ( "title" ), headline . absUrl ( "href" ));
}
オンラインサンプル、完全なソース。
jsoup は、自由な MIT ライセンスの下で配布されるオープン ソース プロジェクトです。ソース コードは GitHub で入手できます。
Android プロジェクトで使用する場合、Java 8 以降の機能をサポートするには、NIO 仕様によるコア ライブラリの脱糖を有効にする必要があります。
jsoup の使用方法についてご質問がある場合、または将来の開発に関するアイデアがある場合は、jsoup ディスカッション経由でご連絡ください。
問題を見つけた場合は、重複がないか確認した後、バグを報告してください。
奥付には、jsoup の歴史と、jsoup の構築に使用されたツールについて説明されています。
jsoup は通常、安定版リリースです。