On dit que les internautes n'ont que sept secondes de mémoire, mais je souhaite enregistrer ces sept secondes de mémoire.
Le projet a été déployé sur le serveur. Il explorera régulièrement la liste de recherche chaude de Weibo tous les jours à 11 heures et 23 heures, l'enregistrera au format de fichier Markdown, puis la téléchargera et la sauvegardera sur GitHub. Vous pouvez la télécharger et la visualiser à volonté. .
Ne me demandez pas pourquoi j'ai choisi les deux instants 11, car j'ai toujours l'impression que de grands événements se produiront autour de ces deux instants.
Peu importe les recherches les plus fréquentes sur Weibo concernant les affaires familiales, les affaires nationales, les affaires mondiales ou les potins en matière de divertissement, je veux juste les enregistrer fidèlement...
Python3.0+
pip install requests
pip install lxml
pip install bs4
ou exécuter
pip install -r requirements.txt
Environnement requis pour l'installation et le fonctionnement
weibo_Hot_Search_bs4.py
(nouveau) ou weibo_Hot_Search.py
dans le répertoire de l'entrepôtpython weibo_Hot_Search_bs4.py
(nouveau) ou python weibo_Hot_Search.py
dans cmdAprès l'exécution, un dossier nommé avec l'heure sera généré dans le dossier actuel, comme suit :
2019年11月08日
(Mise à jour) et un fichier Markdown nommé avec une heure spécifique dans des heures spécifiques sera généré, comme suit :
2019年11月08日15点.md
(Continuer la mise à jour) et un fichier csv nommé avec une heure spécifique dans des heures spécifiques sera généré, comme suit :
2020年08月27日00点.csv
Le lien de la liste de recherche publique sur Sina Weibo est utilisé : https://s.weibo.com/top/summary/
Toutes les sources de données de ce projet proviennent de Sina Weibo. Le contenu des données et leurs droits d'interprétation appartiennent à Sina Weibo.
weibo_Hot_Search_bs4.py
./bs4版数据/
. Le format des données de stockage est序号-标题-热度(或置顶)
. Ce format est facile à traiter et facilite la visualisation ultérieure des données et d'autres analyses..csv
sont stockés dans bs4[.csv]版数据
. bs4[txt]版数据
et lxml版数据
ont été arrêtées. Toutes les nouvelles données sont enregistrées dans les fichiers de données de la version bs4[.csv]
.Licence publique générale GNU v3.0