jsoup هي مكتبة Java تسهل العمل مع HTML وXML الواقعيين. وهو يوفر واجهة برمجة تطبيقات سهلة الاستخدام لجلب عنوان URL وتحليل البيانات واستخراجها ومعالجتها باستخدام أساليب DOM API وCSS ومحددات xpath.
يطبق jsoup مواصفات WHATWG HTML5، ويوزع HTML إلى نفس DOM مثل المتصفحات الحديثة.
تم تصميم jsoup للتعامل مع جميع أنواع HTML الموجودة في البرية؛ من البكر والتحقق من الصحة، إلى حساء العلامة غير الصالحة؛ سيقوم jsoup بإنشاء شجرة تحليل معقولة.
راجع jsoup.org للتنزيلات ووثائق واجهة برمجة التطبيقات الكاملة.
قم بإحضار صفحة ويكيبيديا الرئيسية، وقم بتحليلها إلى DOM، وحدد العناوين من قسم الأخبار في قائمة العناصر:
Document doc = Jsoup . connect ( "https://en.wikipedia.org/" ). get ();
log ( doc . title ());
Elements newsHeadlines = doc . select ( "#mp-itn b a" );
for ( Element headline : newsHeadlines ) {
log ( "%s n t %s" ,
headline . attr ( "title" ), headline . absUrl ( "href" ));
}
عينة على الانترنت، المصدر الكامل.
jsoup هو مشروع مفتوح المصدر يتم توزيعه بموجب ترخيص MIT الليبرالي. كود المصدر متاح على جيثب.
عند استخدامها في مشاريع Android، يجب تمكين إزالة السكر من المكتبة الأساسية باستخدام مواصفات NIO لدعم ميزات Java 8+.
إذا كانت لديك أي أسئلة حول كيفية استخدام jsoup، أو لديك أفكار للتطوير المستقبلي، فيرجى التواصل معنا عبر مناقشات jsoup.
إذا وجدت أي مشاكل، يرجى الإبلاغ عن خطأ بعد التحقق من التكرارات.
تتحدث بيانات النسخ عن تاريخ والأدوات المستخدمة لبناء jsoup.
jsoup هو إصدار مستقر بشكل عام.