jsoup Télécharger - jsoup Téléchargement du code source

jsoup

Code source JAVA

jsoup-1.18.3

Télécharger

jsoup : analyseur HTML Java

jsoup est une bibliothèque Java qui facilite le travail avec du HTML et du XML réels. Il offre une API facile à utiliser pour la récupération d'URL, l'analyse, l'extraction et la manipulation de données à l'aide des méthodes API DOM, des sélecteurs CSS et XPath.

jsoup implémente la spécification WHATWG HTML5 et analyse le HTML selon le même DOM que les navigateurs modernes.

gratter et analyser le HTML à partir d'une URL, d'un fichier ou d'une chaîne
rechercher et extraire des données à l'aide du parcours DOM ou des sélecteurs CSS
manipuler les éléments HTML, les attributs et le texte
nettoyer le contenu soumis par l'utilisateur par rapport à une liste sûre, pour empêcher les attaques XSS
afficher un HTML bien rangé

jsoup est conçu pour gérer toutes les variétés de HTML trouvées dans la nature ; de l'état vierge et en cours de validation à la soupe de balises invalide ; jsoup créera un arbre d'analyse sensé.

Voir jsoup.org pour les téléchargements et la documentation complète de l'API.

Exemple

Récupérez la page d'accueil de Wikipédia, analysez-la dans un DOM et sélectionnez les titres de la section Dans l'actualité dans une liste d'éléments :

 Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
  log ( "%s n t %s" , 
    headline . attr ( "title" ), headline . absUrl ( "href" ));
}

Échantillon en ligne, source complète.

Source ouverte

jsoup est un projet open source distribué sous la licence libérale MIT. Le code source est disponible sur GitHub.

Commencer

Téléchargez le dernier pot jsoup (ou ajoutez-le à votre build Maven/Gradle)
Lire le livre de recettes
Apprécier!

Prise en charge d'Android

Lorsqu'elle est utilisée dans des projets Android, la bibliothèque principale désucrée avec la spécification NIO doit être activée pour prendre en charge les fonctionnalités Java 8+.

Développement et accompagnement

Si vous avez des questions sur l'utilisation de jsoup ou si vous avez des idées de développement futur, veuillez nous contacter via les discussions jsoup.

Si vous rencontrez des problèmes, veuillez signaler un bug après avoir vérifié les doublons.

Le colophon parle de l'histoire et des outils utilisés pour construire jsoup.