WebMagic (إطار عمل زاحف Java) v0.7.2
v0
يعتمد Webmagic تصميمًا معياريًا بالكامل، وتغطي وظائفه دورة حياة الزاحف بأكملها (استخراج الارتباط، وتنزيل الصفحة، واستخراج المحتوى، والثبات)، ويدعم الزحف متعدد الخيوط، والزحف الموزع، وإعادة المحاولة التلقائية، وتخصيص UA/ملفات تعريف الارتباط ووظائف أخرى.
الملامح الرئيسية للويب ماجيك1. تصميم وحدات بالكامل وقابلية التوسع القوية.
2. النواة بسيطة ولكنها تغطي عملية برامج الزحف بأكملها، وهي مرنة وقوية وهي أيضًا مادة جيدة لتعلم كيفية البدء في استخدام برامج الزحف.
3. توفير API لصفحة الاستخراج الغنية.
4. لا يوجد تكوين، ولكن يمكن تنفيذ الزاحف من خلال التعليقات التوضيحية POJO+.
5. دعم الخيوط المتعددة.
6. توزيع الدعم.
7. دعم الزحف إلى صفحات js المعروضة ديناميكيًا.
8. لا توجد تبعيات إطارية ويمكن دمجها بمرونة في المشاريع.
عرض صفحة WebMagic (إطار عمل زاحف Java).