Creación continua y entrega sin fin.
Este proyecto utiliza el método de gestión para capturar artículos de cuentas públicas de WeChat. Primero, debe comprender los dos métodos principales para capturar cuentas públicas de WeChat.
Cómo capturar con elegancia artículos históricos de cuentas públicas de WeChat
Entonces, ahora generalmente hay dos métodos, uno es a través de Sogou WeChat y el otro es a través de proxy. Este proyecto utiliza el método proxy para capturar.
Originalmente escribí una herramienta más compleja, usando anyproxy de Node.js y el marco Laravel de PHP para completar estas funciones, pero un día, mientras me estaba duchando, finalmente descubrí que en realidad había complicado una herramienta que originalmente era muy simple. Le di algunas pautas a un amigo de los medios y empezó a utilizarlo muy rápidamente.
Hay dos cosas en la salida, una es wechat.sqlite y la otra es wechat.csv. Wechat.csv debe generarse mediante el comando wechat_spider csv
.
Los siguientes son los datos correspondientes a mi cuenta pública:
Explicación del encabezado de la tabla:
accountName: 公众号名称 author: 作者 title: 文章标题 contentUrl: 文章链接 cover: 文章封面图 digest: 文章摘要 idx: 如果是1,代表的是当天第一篇文章,如果是2,代表当天第二篇文章,以此类推。 sourceUrl: 阅读原文对应的链接 createTime: 文章创建时间 readNum: 阅读数 likeNum: 点赞数 rewardNum: 赞赏数 electedCommentNum: 被选择显示的回复数
Descargue la última versión del sitio web https://nodejs.org/zh-cn/.
Debido a que depende de sqlite, el proceso de compilación a través de node-gyp requiere python 2.x (3.x no funcionará) y VCBuild.exe, por lo que los estudiantes de Windows deben instalarlo; de lo contrario, se producirán errores.
Los usuarios de Windows pueden descargar e instalar las dependencias del entorno de compilación escribiendo npm install --global --production windows-build-tools
en PowerShell con derechos de administrador.
En Mac, en terminal, en Windows, en cmd:
$npm-v 4.3.0 $pitón Python 2.7.6 (predeterminado, 18 de noviembre de 2013, 15:12:51) [GCC 4.2.1 compatible con Apple LLVM 5.0 (clang-500.2.79)] en darwin Escriba "ayuda", "derechos de autor", "créditos" o "licencia" para obtener más información. >>>
Si se genera información similar a la anterior, demuestra que la herramienta se ha instalado.
$ npm instala wechat_spider -g
$ wechat_spider --ayuda Uso: wechat_spider [opciones] Opciones: -h, --help genera información de uso -V, --version genera el número de versión
Si se genera información similar a la anterior, demuestra que wechat_spider se ha instalado correctamente.
Hay cuatro pasos a seguir: active el proxy, configúrelo en su teléfono, verifique el historial de la cuenta pública, luego comience a rastrear automáticamente y finalmente genere un csv.
Paso 1: abra la herramienta en la terminal en Mac o cmd en Windows:
$wechat_spider
Se requiere un certificado de confianza por primera vez.
La carpeta del certificado se abrirá de forma predeterminada. Si no está abierta, abra http://localhost:8002/fetchCrtFile en el navegador y también podrá obtener el archivo rootCA.crt. Después de obtener el certificado raíz, haga doble clic en él. Siga las indicaciones del sistema operativo para confiar en rootCA:
ventanas
Impermeable
Paso 2: use proxy móvil:
Por primera vez, debe instalar un certificado en su teléfono móvil. Abra el navegador: http://localhost:8002/qr_root. Utilice WeChat para escanear el código QR.
Luego obtenga la dirección IP de su computadora, asumiendo que es 192.168.1.5
Configure el proxy móvil en la computadora:
Paso 3: seleccione una cuenta oficial de WeChat y haga clic para ver el historial
Paso 4: Espere a que aparezca la página "Recopilación de una cuenta pública completada", luego podrá generar csv.
$wechat_spidercsv
Soy Jinma, un programador que quiere hacer algo. Si este gadget te resulta útil, puedes invitarme a una taza de café, gracias :)
MIT.