Alat ini menggunakan Python2.7 dan scrapy untuk mencari artikel akun publik WeChat.
Instal Scrapy dan tanyakan secara langsung.
pip install scrapy
python wescraper/scraper.py account liriansu miawu > we.json # 查询liriansu和miawu相关的公众号
python wescraper/scraper.py key-day liriansu miawu > we.json # 查询liriansu和miawu相关的文章(一天内)
Instal Scrapy dan Tornado dan kueri melalui server lokal:
pip install scrapy tornado
python wescraper/server.py
Setelah server dimulai, Anda dapat memperoleh daftar artikel akun publik WeChat melalui http://localhost/account/foo/bar/baz...
Atau Anda dapat menggunakan http://localhost/key-year/foo/bar/baz...
untuk menanyakan artikel akun publik berdasarkan kata kunci.
Lihat kode sumber scraper.py
Untuk beberapa parameter yang dapat dikonfigurasi, lihat config.py
Meminta akun publik akan mendapatkan akun pertama dalam daftar secara default.
Alat ini mungkin diblokir. Untuk solusinya, silakan merujuk ke Scrapy: Menghindari pemblokiran (secara umum, mengubah IP dapat menyelesaikan masalah)
Kumpulan cookie disimpan di cookie.py, yang akan memilih n cookie secara acak untuk diakses. Jika cookie dilarang, cookie baru akan diganti.
Selamat memodifikasi berdasarkan kode ini, ingatlah untuk menjalankan pengujian unit: python wescraper/test/test.py
Alat ini sepenuhnya bergantung pada Sogou WeChat untuk mencari dan merayapi artikel. Jika antarmuka pencarian Sogou WeChat berubah, perayapan mungkin gagal.
Python itu hebat!
Hak cipta kode adalah milik penulis GitHub asli @LKI. Penggunaan komersial dilarang keras, reproduksi/Garpu lainnya gratis.