يقال أن الأشخاص على الإنترنت لديهم سبع ثوانٍ فقط من الذاكرة، لكني أريد تسجيل هذه الثواني السبع من الذاكرة.
تم نشر المشروع على الخادم، وسيقوم بالزحف إلى قائمة البحث الساخنة على Weibo بانتظام في الساعة 11 صباحًا و11 مساءً كل يوم، وحفظها بتنسيق ملف Markdown، ثم تحميلها ونسخها احتياطيًا على GitHub. يمكنك تنزيلها وعرضها حسب الرغبة .
لا تسألني لماذا اخترت النقطتين الزمنيتين 11، لأنني أشعر دائمًا أن الأحداث الكبيرة ستحدث حول هاتين النقطتين الزمنيتين.
بغض النظر عن عمليات البحث الساخنة على Weibo حول شؤون الأسرة أو الشؤون الوطنية أو الشؤون العالمية أو الشائعات الترفيهية، أريد فقط أن أسجلها بأمانة...
بايثون 3.0+
pip install requests
pip install lxml
pip install bs4
أو تنفيذ
pip install -r requirements.txt
البيئة المطلوبة للتركيب والتشغيل
weibo_Hot_Search_bs4.py
(جديد) أو weibo_Hot_Search.py
في دليل المستودعpython weibo_Hot_Search_bs4.py
(جديد) أو python weibo_Hot_Search.py
في cmdبعد التشغيل، سيتم إنشاء مجلد مسمى مع الوقت في المجلد الحالي، على النحو التالي:
2019年11月08日
(محدث) وسيتم إنشاء ملف Markdown مسمى بوقت محدد في ساعات محددة، كما يلي:
2019年11月08日15点.md
(متابعة التحديث) وسيتم إنشاء ملف CSV مسمى بوقت محدد في ساعات محددة، كما يلي:
2020年08月27日00点.csv
يتم استخدام رابط قائمة البحث العامة الساخنة على Sina Weibo: https://s.weibo.com/top/summary/
جميع مصادر البيانات لهذا المشروع تأتي من Sina Weibo. محتوى البيانات وحقوق تفسيرها مملوكة لشركة Sina Weibo.
weibo_Hot_Search_bs4.py
./bs4版数据/
. تنسيق بيانات التخزين هو序号-标题-热度(或置顶)
. هذا التنسيق سهل المعالجة ويسهل تصور البيانات اللاحقة والتحليلات الأخرى..csv
الجديدة في مجلد bs4[.csv]版数据
. bs4[txt]版数据
lxml版数据
. يتم حفظ جميع البيانات الجديدة في ملفات بيانات إصدار bs4[.csv]
.رخصة جنو العامة v3.0