إبداع مستمر وتسليم لا نهاية له
يستخدم هذا المشروع طريقة الإدارة لالتقاط مقالات حساب WeChat العام، أولاً، تحتاج إلى فهم الطريقتين الرئيسيتين لالتقاط حسابات WeChat العامة، يرجى الرجوع إلى مقالتي:
كيفية التقاط المقالات التاريخية لحسابات WeChat العامة بأناقة
إذن هناك الآن طريقتان بشكل عام، إحداهما من خلال Sogou WeChat والأخرى من خلال الوكيل. يستخدم هذا المشروع طريقة الوكيل للالتقاط.
لقد كتبت في الأصل أداة أكثر تعقيدًا، باستخدام Anyproxy الخاص بـ Node.js وإطار عمل Laravel الخاص بـ PHP لإكمال هذه الوظائف، ولكن في أحد الأيام عندما كنت أستحم، اكتشفت أخيرًا أنني قمت بالفعل بتعقيد أداة كانت في الأصل بسيطة للغاية. لقد قدمت بعض الإرشادات لصديق إعلامي وبدأ في استخدامه بسرعة كبيرة.
هناك شيئان في الإخراج، أحدهما wechat.sqlite، والآخر wechat.csv يجب إنشاؤه بواسطة الأمر wechat_spider csv
.
فيما يلي البيانات المقابلة لحسابي العام:
شرح رأس الجدول:
accountName: 公众号名称 author: 作者 title: 文章标题 contentUrl: 文章链接 cover: 文章封面图 digest: 文章摘要 idx: 如果是1,代表的是当天第一篇文章,如果是2,代表当天第二篇文章,以此类推。 sourceUrl: 阅读原文对应的链接 createTime: 文章创建时间 readNum: 阅读数 likeNum: 点赞数 rewardNum: 赞赏数 electedCommentNum: 被选择显示的回复数
قم بتنزيل أحدث إصدار من الموقع https://nodejs.org/zh-cn/.
نظرًا لأنها تعتمد على sqlite، فإن عملية التجميع من خلال Node-gyp تتطلب python 2.x (3.x لا يعمل) وVCBuild.exe، لذلك يجب على طلاب Windows تثبيته، وإلا ستحدث أخطاء.
يمكن لمستخدمي Windows تنزيل وتثبيت تبعيات بيئة الترجمة عن طريق كتابة npm install --global --production windows-build-tools
ضمن PowerShell مع حقوق المسؤول.
على نظام Mac، ضمن Terminal، على Windows، ضمن cmd:
$ npm -v 4.3.0 $ بيثون Python 2.7.6 (افتراضي، 18 تشرين الثاني (نوفمبر) 2013، الساعة 15:12:51) [GCC 4.2.1 متوافق مع Apple LLVM 5.0 (clang-500.2.79)] على داروين اكتب "مساعدة" أو "حقوق الطبع والنشر" أو "الاعتمادات" أو "الترخيص" لمزيد من المعلومات. >>>
إذا تم إخراج معلومات مشابهة لما ورد أعلاه، فهذا يثبت أنه تم تثبيت الأداة.
$ npm تثبيت wechat_spider -g
$ wechat_spider --مساعدة الاستخدام: wechat_spider [خيارات] خيارات: -h، - مساعدة في إخراج معلومات الاستخدام -V، --version إخراج رقم الإصدار
إذا تم إخراج معلومات مشابهة لما ورد أعلاه، فهذا يثبت أنه تم تثبيت wechat_spider بنجاح.
هناك أربع خطوات يجب استخدامها: تشغيل الوكيل، وتعيين الوكيل على هاتفك، والتحقق من سجل الحساب العام، ثم البدء في الزحف تلقائيًا، وأخيرًا إنشاء ملف CSV.
الخطوة 1: افتح الأداة في الوحدة الطرفية على نظام Mac أو cmd على نظام Windows:
$wechat_spider
مطلوب شهادة الثقة لأول مرة.
سيتم فتح مجلد الشهادة بشكل افتراضي. إذا لم يتم فتحه، افتح http://localhost:8002/fetchCrtFile في المتصفح ويمكنك أيضًا الحصول على ملف rootCA.crt بعد الحصول على الشهادة الجذرية، انقر فوقه نقرًا مزدوجًا اتبع مطالبات نظام التشغيل بالثقة في rootCA:
ويندوز
ماك
الخطوة 2: استخدام الوكيل المحمول:
لأول مرة، تحتاج إلى تثبيت شهادة على هاتفك المحمول. افتح المتصفح: http://localhost:8002/qr_root. استخدم WeChat لمسح رمز الاستجابة السريعة.
ثم احصل على عنوان IP لجهاز الكمبيوتر الخاص بك، على افتراض أنه 192.168.1.5
ضبط وكيل الهاتف المحمول على جهاز الكمبيوتر:
الخطوة 3: حدد حساب WeChat الرسمي وانقر لعرض السجل
الخطوة 4: انتظر حتى تظهر صفحة "اكتمل تجميع الحساب العام"، ثم يمكنك إنشاء ملف CSV.
$wechat_spider CSV
أنا جينما، مبرمج يريد أن يفعل شيئًا ما. إذا كانت هذه الأداة مفيدة لك، يمكنك أن تشتري لي فنجانًا من القهوة، شكرًا لك :)
معهد ماساتشوستس للتكنولوجيا.