Penciptaan berkelanjutan dan pengiriman tanpa akhir
Proyek ini menggunakan metode manajemen untuk menangkap artikel akun publik WeChat. Pertama, Anda perlu memahami dua metode utama untuk menangkap akun publik WeChat.
Cara menangkap artikel sejarah akun publik WeChat dengan elegan
Jadi sekarang umumnya ada dua metode, satu melalui Sogou WeChat, dan yang lainnya melalui proxy. Proyek ini menggunakan metode proxy untuk menangkapnya.
Saya awalnya menulis alat yang lebih kompleks, menggunakan anyproxy Node.js dan kerangka Laravel PHP untuk menyelesaikan fungsi-fungsi ini. Namun suatu hari ketika saya sedang mandi, saya akhirnya menyadari bahwa saya sebenarnya telah memperumit alat yang awalnya sangat sederhana. Saya memberikan beberapa panduan kepada seorang teman media dan dia mulai menggunakannya dengan sangat cepat.
Ada dua hal dalam output, satu adalah wechat.sqlite, dan yang lainnya adalah wechat.csv. perlu dibuat dengan perintah wechat_spider csv
.
Berikut data yang sesuai dengan akun publik saya:
Penjelasan tajuk tabel:
accountName: 公众号名称 author: 作者 title: 文章标题 contentUrl: 文章链接 cover: 文章封面图 digest: 文章摘要 idx: 如果是1,代表的是当天第一篇文章,如果是2,代表当天第二篇文章,以此类推。 sourceUrl: 阅读原文对应的链接 createTime: 文章创建时间 readNum: 阅读数 likeNum: 点赞数 rewardNum: 赞赏数 electedCommentNum: 被选择显示的回复数
Unduh versi terbaru dari situs web https://nodejs.org/zh-cn/.
Karena mengandalkan sqlite, maka proses kompilasi melalui node-gyp memerlukan python 2.x (3.x tidak berfungsi) dan VCBuild.exe, sehingga mahasiswa Windows harus menginstalnya, jika tidak maka akan terjadi error.
Pengguna Windows dapat mengunduh dan menginstal dependensi lingkungan kompilasi dengan mengetikkan npm install --global --production windows-build-tools
di bawah PowerShell dengan hak administrator.
Di Mac, di bawah terminal, di Windows, di bawah cmd:
$npm-v 4.3.0 $python Python 2.7.6 (default, 18 November 2013, 15:12:51) [Kompatibel dengan GCC 4.2.1 Apple LLVM 5.0 (clang-500.2.79)] di darwin Ketik "bantuan", "hak cipta", "kredit" atau "lisensi" untuk informasi lebih lanjut. >>>
Jika keluar informasi serupa di atas, itu membuktikan bahwa alat telah diinstal.
$ npm instal wechat_spider -g
$ wechat_spider --bantuan Penggunaan: wechat_spider [pilihan] Pilihan: -h, --help menampilkan informasi penggunaan -V, --version menampilkan nomor versi
Jika keluar informasi seperti di atas, itu membuktikan bahwa wechat_spider telah berhasil diinstal.
Ada empat langkah untuk menggunakannya: aktifkan proxy, atur proxy di ponsel Anda, periksa riwayat akun publik, lalu mulai perayapan otomatis, dan terakhir buat csv.
Langkah 1: Buka alat di terminal pada Mac atau cmd di Windows:
$wechat_spider
Sertifikat kepercayaan diperlukan untuk pertama kalinya.
Folder sertifikat akan terbuka secara default. Jika tidak dibuka, buka http://localhost:8002/fetchCrtFile di browser dan Anda juga bisa mendapatkan file rootCA.crt. Setelah mendapatkan sertifikat root, klik dua kali dan ikuti petunjuk sistem operasi untuk mempercayai rootCA:
jendela
Mac
Langkah 2: Gunakan proksi seluler:
Untuk pertama kalinya, Anda perlu memasang sertifikat di ponsel Anda. Buka browser: http://localhost:8002/qr_root. Gunakan WeChat untuk memindai kode QR.
Kemudian dapatkan alamat IP komputer Anda, dengan asumsi 192.168.1.5
Setel proxy seluler ke komputer:
Langkah 3: Pilih akun resmi WeChat dan klik untuk melihat riwayat
Langkah 4: Tunggu hingga muncul halaman “Koleksi akun publik selesai”, barulah Anda bisa generate csv.
$ wechat_spider csv
Saya Jinma, seorang programmer yang ingin melakukan sesuatu. Jika gadget ini bermanfaat bagi Anda, Anda dapat membelikan saya secangkir kopi, terima kasih :)
MIT.