เครื่องมือนี้ใช้ Python2.7 และ scrapy เพื่อค้นหาบทความในบัญชีสาธารณะ WeChat
ติดตั้ง Scrapy และสอบถามโดยตรง
pip install scrapy
python wescraper/scraper.py account liriansu miawu > we.json # 查询liriansu和miawu相关的公众号
python wescraper/scraper.py key-day liriansu miawu > we.json # 查询liriansu和miawu相关的文章(一天内)
ติดตั้ง Scrapy และ Tornado และสอบถามผ่านเซิร์ฟเวอร์ภายในเครื่อง:
pip install scrapy tornado
python wescraper/server.py
หลังจากที่เซิร์ฟเวอร์เริ่มทำงาน คุณสามารถรับรายการบทความบัญชีสาธารณะ WeChat ผ่านทาง http://localhost/account/foo/bar/baz...
หรือคุณสามารถใช้ http://localhost/key-year/foo/bar/baz...
เพื่อค้นหาบทความในบัญชีสาธารณะด้วยคำหลัก
ดูซอร์สโค้ดของ scraper.py
สำหรับพารามิเตอร์ที่กำหนดค่าได้บางตัว โปรดดูที่ config.py
การสอบถามบัญชีสาธารณะจะได้รับบัญชีแรกในรายการตามค่าเริ่มต้น
เครื่องมือนี้อาจถูกแบน สำหรับวิธีแก้ปัญหา โปรดดูที่ Scrapy: การหลีกเลี่ยงการถูกแบน (โดยทั่วไป การเปลี่ยน IP สามารถแก้ปัญหาได้)
พูลคุกกี้ถูกเก็บรักษาไว้ใน cookie.py ซึ่งจะสุ่มเลือก n คุกกี้สำหรับการเข้าถึง หากคุกกี้ถูกแบน คุกกี้ใหม่จะถูกแทนที่
ยินดีต้อนรับสู่การแก้ไขโดยใช้โค้ดนี้ อย่าลืมรันการทดสอบหน่วย: python wescraper/test/test.py
เครื่องมือนี้อาศัย Sogou WeChat อย่างสมบูรณ์ในการค้นหาและรวบรวมข้อมูลบทความ หากอินเทอร์เฟซการค้นหา Sogou WeChat เปลี่ยนแปลง การรวบรวมข้อมูลอาจล้มเหลว
หลามเยี่ยมมาก!
ลิขสิทธิ์รหัสเป็นของผู้เขียน GitHub ดั้งเดิม @LKI ห้ามนำไปใช้ในเชิงพาณิชย์โดยเด็ดขาด การทำซ้ำ/ส้อมอื่นๆ ฟรี