웹매직
v0
Webmagic은 완전한 모듈식 설계를 채택하고 있으며 그 기능은 전체 크롤러 수명 주기(링크 추출, 페이지 다운로드, 콘텐츠 추출, 지속성)를 포괄하고 멀티 스레드 크롤링, 분산 크롤링, 자동 재시도 및 맞춤형 UA/쿠키 및 기타 기능을 지원합니다.
웹매직의 주요 기능 1. 완전한 모듈식 설계와 강력한 확장성.
2. 핵심은 단순하지만 크롤러의 전체 프로세스를 다루고 있으며 유연하고 강력하며 크롤러를 시작하는 방법을 배우기에도 좋은 자료입니다.
3. 풍부한 추출 페이지 API를 제공합니다.
4. 구성은 없지만 POJO+주석을 통해 크롤러를 구현할 수 있습니다.
5. 멀티스레딩을 지원합니다.
6. 지원 배포.
7. 동적으로 렌더링된 js 페이지 크롤링을 지원합니다.
8. 프레임워크 종속성이 없으며 프로젝트에 유연하게 포함될 수 있습니다.