jsoup Download – jsoup Quellcode herunterladen

jsoup

JAVA-Quellcode

jsoup-1.18.3

Herunterladen

jsoup: Java HTML Parser

jsoup ist eine Java-Bibliothek, die die Arbeit mit realem HTML und XML vereinfacht. Es bietet eine benutzerfreundliche API zum Abrufen von URLs, zum Parsen, Extrahieren und Bearbeiten von Daten mithilfe von DOM-API-Methoden, CSS und XPath-Selektoren.

jsoup implementiert die WHATWG-HTML5-Spezifikation und analysiert HTML im selben DOM wie moderne Browser.

Scrapen und analysieren Sie HTML aus einer URL, Datei oder Zeichenfolge
Suchen und extrahieren Sie Daten mithilfe von DOM-Traversal oder CSS-Selektoren
Bearbeiten Sie die HTML-Elemente, Attribute und den Text
Bereinigen Sie vom Benutzer übermittelte Inhalte anhand einer sicheren Liste, um XSS-Angriffe zu verhindern
Ausgabe von ordentlichem HTML

jsoup ist für den Umgang mit allen gängigen HTML-Varianten konzipiert. von makellos und validierend bis hin zu ungültiger Tag-Suppe; jsoup erstellt einen sinnvollen Analysebaum.

Downloads und die vollständige API-Dokumentation finden Sie unter jsoup.org .

Beispiel

Rufen Sie die Wikipedia-Homepage ab, parsen Sie sie in ein DOM und wählen Sie die Schlagzeilen aus dem Abschnitt „In den Nachrichten“ in einer Liste von Elementen aus:

 Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
  log ( "%s n t %s" , 
    headline . attr ( "title" ), headline . absUrl ( "href" ));
}

Online-Beispiel, vollständige Quelle.

Open Source

jsoup ist ein Open-Source-Projekt, das unter der liberalen MIT-Lizenz vertrieben wird. Der Quellcode ist auf GitHub verfügbar.

Erste Schritte

Laden Sie das neueste JSoup-JAR herunter (oder fügen Sie es Ihrem Maven/Gradle-Build hinzu)
Lesen Sie das Kochbuch
Genießen!

Android-Unterstützung

Bei Verwendung in Android-Projekten sollte die Entzuckerung der Kernbibliothek mit der NIO-Spezifikation aktiviert werden, um Java 8+-Funktionen zu unterstützen.