تستخدم هذه الأداة Python2.7 وScrapy للبحث في مقالات الحساب العام لـ WeChat.
قم بتثبيت Scrapy والاستعلام مباشرة.
pip install scrapy
python wescraper/scraper.py account liriansu miawu > we.json # 查询liriansu和miawu相关的公众号
python wescraper/scraper.py key-day liriansu miawu > we.json # 查询liriansu和miawu相关的文章(一天内)
قم بتثبيت Scrapy وTornado واستعلام من خلال الخادم المحلي:
pip install scrapy tornado
python wescraper/server.py
بعد بدء تشغيل الخادم، يمكنك الحصول على قائمة مقالات حساب WeChat العام من خلال http://localhost/account/foo/bar/baz...
أو يمكنك استخدام http://localhost/key-year/foo/bar/baz...
للاستعلام عن مقالات الحساب العام حسب الكلمة الرئيسية.
راجع شفرة المصدر Scraper.py
للحصول على بعض المعلمات القابلة للتكوين، راجع config.py
سيؤدي الاستعلام عن الحساب العام إلى الحصول على الحساب الأول في القائمة افتراضيًا.
قد تكون هذه الأداة محظورة للحصول على الحلول، يرجى الرجوع إلى Scrapy: تجنب الحظر (بشكل عام، يمكن أن يؤدي تغيير عنوان IP إلى حل المشكلة).
يتم الاحتفاظ بمجمع ملفات تعريف الارتباط في ملف تعريف الارتباط، والذي سيحدد عشوائيًا عدد ملفات تعريف الارتباط للوصول إليها. إذا تم حظر ملف تعريف الارتباط، فسيتم استبدال ملف تعريف ارتباط جديد.
مرحبًا بك في التعديل استنادًا إلى هذا الرمز، تذكر إجراء اختبار الوحدة: python wescraper/test/test.py
تعتمد هذه الأداة بشكل كامل على Sogou WeChat للبحث عن المقالات والزحف إليها. إذا تغيرت واجهة بحث Sogou WeChat، فقد يفشل الزحف.
بايثون عظيمة!
حقوق الطبع والنشر للكود مملوكة لمؤلف GitHub الأصلي @LKI. الاستخدام التجاري ممنوع منعا باتا، وأي نسخ أخرى/الشوكة مجانية.