Weibo_Hot_Search
1.0.0
都說網路人的記憶只有七秒鐘,但我卻想記錄下這七秒鐘的記憶。
專案已部署在伺服器,會在每天的上午11 點和晚上11 點定時爬取微博的熱搜榜內容,保存為Markdown 文件格式,然後上傳備份到GitHub 你可以隨意下載查看。
不要問我為什麼選擇11 這兩個時間點,因為個人總覺得這兩個時間點左右會有大事件發生。
不管微博熱搜上是家事國事天下事,亦或是娛樂八卦是非事,我只是想忠實的記錄下來...
Python 3.0 +
pip install requests
pip install lxml
pip install bs4
或執行
pip install -r requirements.txt
進行安裝運作所需的環境
weibo_Hot_Search_bs4.py
(新增) 或weibo_Hot_Search.py
python weibo_Hot_Search_bs4.py
(新增) 或python weibo_Hot_Search.py
運行結束後會在目前資料夾下產生以時間命名的資料夾,如下:
2019年11月08日
(已停更)並且會產生以特定小時為單位的特定時間命名的Markdown 文件,如下:
2019年11月08日15点.md
(繼續更)並且會產生以特定小時為單位的特定時間命名的csv文件,如下:
2020年08月27日00点.csv
使用的是新浪微博的公開熱搜榜單連結:https://s.weibo.com/top/summary/
本計畫的所有資料來源均來自新浪微博資料內容及其解釋權歸新浪微博所有。
weibo_Hot_Search_bs4.py
./bs4版数据/
目錄下,儲存資料格式為序号-标题-热度(或置顶)
,此格式易於處理,便於後續進行資料視覺化和其他分析.csv
檔案統一存放於bs4[.csv]版数据
資料夾中bs4[txt]版数据
和lxml版数据
已停更,所有新資料均保存在bs4[.csv]
版資料檔中GNU General Public License v3.0