Se dice que la gente en Internet sólo tiene siete segundos de memoria, pero quiero registrar estos siete segundos de memoria.
El proyecto se ha implementado en el servidor. Rastreará la lista de búsqueda activa de Weibo regularmente a las 11 a. m. y a las 11 p. m. todos los días, la guardará en formato de archivo Markdown y luego la cargará y hará una copia de seguridad en GitHub. Puede descargarlo y verlo a voluntad. .
No me pregunten por qué elegí los dos puntos temporales del 11, porque siempre siento que sucederán grandes eventos alrededor de estos dos puntos temporales.
No importa cuáles sean las búsquedas candentes en Weibo sobre asuntos familiares, asuntos estatales, asuntos mundiales o chismes de entretenimiento, solo quiero registrarlo fielmente...
Pitón 3.0+
pip install requests
pip install lxml
pip install bs4
o ejecutar
pip install -r requirements.txt
Entorno requerido para la instalación y operación.
weibo_Hot_Search_bs4.py
(nuevo) o weibo_Hot_Search.py
en el directorio del almacénpython weibo_Hot_Search_bs4.py
(nuevo) o python weibo_Hot_Search.py
en cmdDespués de ejecutar, se generará una carpeta con el nombre de la hora en la carpeta actual, de la siguiente manera:
2019年11月08日
(Actualizado) y se generará un archivo Markdown nombrado con una hora específica en horas específicas, de la siguiente manera:
2019年11月08日15点.md
(Continuar actualizando) y se generará un archivo csv nombrado con una hora específica en horas específicas, de la siguiente manera:
2020年08月27日00点.csv
Se utiliza el enlace de la lista pública de búsqueda activa en Sina Weibo: https://s.weibo.com/top/summary/
Todas las fuentes de datos de este proyecto provienen de Sina Weibo. El contenido de los datos y sus derechos de interpretación pertenecen a Sina Weibo.
weibo_Hot_Search_bs4.py
./bs4版数据/
. El formato de almacenamiento de datos es序号-标题-热度(或置顶)
. Este formato es fácil de procesar y facilita la visualización de datos posterior y otros análisis..csv
se almacenan en bs4[.csv]版数据
. bs4[txt]版数据
y lxml版数据
se han detenido. Todos los datos nuevos se guardan en archivos de datos de la versión bs4[.csv]
.Licencia pública general GNU v3.0