Говорят, что у людей в Интернете всего семь секунд памяти, но я хочу записать эти семь секунд памяти.
Проект развернут на сервере. Он будет регулярно сканировать список горячего поиска Weibo каждый день в 11:00 и 23:00, сохранять его в формате файла Markdown, а затем загружать и создавать резервные копии на GitHub. Вы можете скачать и просмотреть его по своему желанию. .
Не спрашивайте меня, почему я выбрал две временные точки из 11, потому что я всегда чувствую, что большие события произойдут примерно в эти две временные точки.
Неважно, какие горячие запросы на Weibo касаются семейных, государственных, мировых дел или сплетен о развлечениях, я просто хочу честно это записать...
Питон 3.0+
pip install requests
pip install lxml
pip install bs4
или выполнить
pip install -r requirements.txt
Среда, необходимая для установки и эксплуатации
weibo_Hot_Search_bs4.py
(новый) или weibo_Hot_Search.py
в каталоге хранилища.python weibo_Hot_Search_bs4.py
(новый) или python weibo_Hot_Search.py
в cmdПосле запуска в текущей папке будет создана папка с именем и временем следующим образом:
2019年11月08日
(Обновлено), и будет создан файл Markdown с указанием определенного времени в определенные часы следующим образом:
2019年11月08日15点.md
(Продолжайте обновление), и будет создан файл csv с указанием определенного времени и часов следующим образом:
2020年08月27日00点.csv
Используется ссылка на общедоступный список горячего поиска на Sina Weibo: https://s.weibo.com/top/summary/
Все источники данных для этого проекта взяты из Sina Weibo. Содержание данных и права на их интерпретацию принадлежат Sina Weibo.
weibo_Hot_Search_bs4.py
./bs4版数据/
. Формат хранения данных —序号-标题-热度(或置顶)
. Этот формат легко обрабатывается и облегчает последующую визуализацию данных и другой анализ..csv
хранятся в папке bs4[.csv]版数据
. bs4[txt]版数据
и lxml版数据
остановлены. Все новые данные сохраняются в файлах данных версии bs4[.csv]
.Стандартная общественная лицензия GNU v3.0