Es heißt, dass Menschen im Internet nur sieben Sekunden Gedächtnis haben, aber ich möchte diese sieben Sekunden Gedächtnis aufzeichnen.
Das Projekt wurde auf dem Server bereitgestellt. Es crawlt täglich um 11 und 23 Uhr die Hot Search-Liste, speichert sie im Markdown-Dateiformat und lädt sie dann auf GitHub hoch .
Fragen Sie mich nicht, warum ich die beiden Zeitpunkte 11 gewählt habe, denn ich habe immer das Gefühl, dass um diese beiden Zeitpunkte herum große Ereignisse stattfinden werden.
Egal, was die heißen Suchanfragen auf Weibo zu Familienangelegenheiten, nationalen Angelegenheiten, Weltangelegenheiten oder Unterhaltungsklatsch drehen, ich möchte es einfach getreu aufzeichnen ...
Python 3.0+
pip install requests
pip install lxml
pip install bs4
oder ausführen
pip install -r requirements.txt
Für Installation und Betrieb erforderliche Umgebung
weibo_Hot_Search_bs4.py
(neu) oder weibo_Hot_Search.py
im Warehouse-Verzeichnis auspython weibo_Hot_Search_bs4.py
(neu) oder python weibo_Hot_Search.py
in cmd ausNach der Ausführung wird im aktuellen Ordner ein mit der Zeit benannter Ordner wie folgt generiert:
2019年11月08日
(Aktualisiert) und eine Markdown-Datei mit dem Namen einer bestimmten Zeit in bestimmten Stunden wird wie folgt generiert:
2019年11月08日15点.md
(Weiter aktualisieren) und eine CSV-Datei mit dem Namen einer bestimmten Zeit in bestimmten Stunden wird wie folgt generiert:
2020年08月27日00点.csv
Es wird der Link zur öffentlichen Hot Search-Liste auf Sina Weibo verwendet: https://s.weibo.com/top/summary/
Alle Datenquellen für dieses Projekt stammen von Sina Weibo. Der Dateninhalt und seine Interpretationsrechte liegen bei Sina Weibo.
weibo_Hot_Search_bs4.py
hinzugefügt./bs4版数据/
gespeichert. Das Speicherdatenformat ist序号-标题-热度(或置顶)
. Dieses Format ist einfach zu verarbeiten und erleichtert die anschließende Datenvisualisierung und andere Analysen..csv
Dateien werden im bs4[.csv]版数据
gespeichert. bs4[txt]版数据
und lxml版数据
wurden gestoppt. Alle neuen Daten werden in bs4[.csv]
-Versionsdatendateien gespeichert.GNU General Public License v3.0