Dikatakan bahwa orang-orang di Internet hanya memiliki memori tujuh detik, tetapi saya ingin merekam memori tujuh detik ini.
Proyek ini telah diterapkan di server. Proyek ini akan merayapi daftar pencarian populer Weibo secara teratur pada pukul 11.00 dan 23.00 setiap hari, menyimpannya dalam format file Markdown, lalu mengunggah dan mencadangkannya ke GitHub. Anda dapat mengunduh dan melihatnya sesuka hati .
Jangan tanya kenapa saya memilih dua titik waktu 11, karena saya selalu merasa peristiwa besar akan terjadi di sekitar dua titik waktu tersebut.
Tidak peduli apa pun penelusuran terpopuler di Weibo tentang urusan keluarga, urusan negara, urusan dunia, atau gosip hiburan, saya hanya ingin merekamnya dengan setia...
Python 3.0+
pip install requests
pip install lxml
pip install bs4
atau mengeksekusi
pip install -r requirements.txt
Lingkungan diperlukan untuk instalasi dan pengoperasian
weibo_Hot_Search_bs4.py
(baru) atau weibo_Hot_Search.py
di direktori gudangpython weibo_Hot_Search_bs4.py
(baru) atau python weibo_Hot_Search.py
di cmdSetelah dijalankan, folder bernama waktu akan dibuat di folder saat ini, sebagai berikut:
2019年11月08日
(Diperbarui) dan file Markdown yang diberi nama dengan waktu tertentu dalam jam tertentu akan dihasilkan, sebagai berikut:
2019年11月08日15点.md
(Lanjutkan pembaruan) dan file csv yang diberi nama dengan waktu tertentu pada jam tertentu akan dihasilkan, sebagai berikut:
2020年08月27日00点.csv
Tautan daftar pencarian populer publik di Sina Weibo digunakan: https://s.weibo.com/top/summary/
Semua sumber data untuk proyek ini berasal dari Sina Weibo. Konten data dan hak interpretasinya adalah milik Sina Weibo.
weibo_Hot_Search_bs4.py
./bs4版数据/
. Format data penyimpanannya adalah序号-标题-热度(或置顶)
..csv
baru disimpan di folder bs4[.csv]版数据
. bs4[txt]版数据
dan lxml版数据
telah dihentikan. Semua data baru disimpan dalam file data versi bs4[.csv]
.Lisensi Publik Umum GNU v3.0