wescraper
1.0.0
이 도구는 Python2.7 및 scrapy를 사용하여 WeChat 공개 계정 기사를 검색합니다.
Scrapy를 설치하고 직접 쿼리하세요.
pip install scrapy
python wescraper/scraper.py account liriansu miawu > we.json # 查询liriansu和miawu相关的公众号
python wescraper/scraper.py key-day liriansu miawu > we.json # 查询liriansu和miawu相关的文章(一天内)
Scrapy와 Tornado를 설치하고 로컬 서버를 통해 쿼리합니다.
pip install scrapy tornado
python wescraper/server.py
서버가 시작된 후 http://localhost/account/foo/bar/baz...
또는 http://localhost/key-year/foo/bar/baz...
사용하여 공개 계정 기사를 키워드로 쿼리할 수 있습니다.
scraper.py 소스 코드 보기
일부 구성 가능한 매개변수는 config.py를 참조하세요.
공용 계정을 쿼리하면 기본적으로 목록의 첫 번째 계정이 표시됩니다.
이 도구는 금지될 수 있습니다. 해결 방법은 Scrapy: 금지 방지(일반적으로 IP를 변경하면 문제가 해결될 수 있음)를 참조하세요.
쿠키 풀은 cookie.py에 유지되며, 쿠키가 금지되면 새 쿠키가 대체됩니다.
이 코드를 기반으로 수정하는 것을 환영합니다. 단위 테스트를 실행하는 것을 잊지 마세요: python wescraper/test/test.py
이 도구는 Sogou WeChat에 전적으로 의존하여 기사를 검색하고 크롤링합니다. Sogou WeChat 검색 인터페이스가 변경되면 크롤링이 실패할 수 있습니다.
파이썬은 훌륭해요!
코드 저작권은 원래 GitHub 작성자인 @LKI에게 있습니다. 상업적 이용은 엄격히 금지되며, 기타 복제/포크는 무료입니다.