Esta herramienta utiliza Python2.7 y scrapy para buscar artículos de cuentas públicas de WeChat.
Instale Scrapy y consulte directamente.
pip install scrapy
python wescraper/scraper.py account liriansu miawu > we.json # 查询liriansu和miawu相关的公众号
python wescraper/scraper.py key-day liriansu miawu > we.json # 查询liriansu和miawu相关的文章(一天内)
Instale Scrapy y Tornado y consulte a través del servidor local:
pip install scrapy tornado
python wescraper/server.py
Una vez iniciado el servidor, puede obtener la lista de artículos de la cuenta pública de WeChat a través de http://localhost/account/foo/bar/baz...
O puede utilizar http://localhost/key-year/foo/bar/baz...
para consultar artículos de cuentas públicas por palabra clave.
Ver el código fuente de scraper.py
Para algunos parámetros configurables, consulte config.py
Al consultar la cuenta pública, se obtendrá la primera de la lista de forma predeterminada.
Esta herramienta puede estar prohibida Para obtener soluciones, consulte Scrapy: evitar la prohibición (en términos generales, cambiar la IP puede resolver el problema).
Se mantiene un grupo de cookies en cookie.py, que seleccionará aleatoriamente n cookies para el acceso. Si la cookie está prohibida, se reemplazará por una nueva.
Bienvenido a modificar según este código, recuerde ejecutar la prueba unitaria: python wescraper/test/test.py
Esta herramienta depende completamente de Sogou WeChat para buscar y rastrear artículos. Si la interfaz de búsqueda de Sogou WeChat cambia, el rastreo puede fallar.
¡Python es genial!
Los derechos de autor del código pertenecen al autor original de GitHub @LKI. El uso comercial está estrictamente prohibido, otras reproducciones/Fork son gratuitas.