Pengembangan sekunder dan penyerahan PR dipersilakan?
Gunakan Python untuk membuat perayap untuk merayapi artikel historis dan konten akun publik yang ditunjuk, dan mendukung pemfilteran artikel menggunakan kata kunci.
F12
untuk membuka antarmuka berikut, dan beralih ke [Jaringan] (1) Artikel sejarah rekening publik diperoleh dalam satu halaman. Umumnya terdapat 5-10 artikel dalam satu halaman.
(2) Semakin kecil nomor halaman artikel sejarah akun publik, semakin baru waktu penyimpanan artikel terbaru.
(3) Disarankan nomor halaman awal dimulai dari 0
(4) Jumlah halaman yang dirayapi tidak boleh 0, jika tidak maka hasil crawling akan kosong
Masukkan nama file yang benar dan pilih lokasi file.
(1) Fungsi : Digunakan untuk memfilter artikel berdasarkan kata kunci dan memperoleh artikel yang mengandung kata kunci pada judul artikel. Jika tidak diisi, semua artikel akan diambil.
(2) Format:关键词1;关键词2;关键词3
Pisahkan dengan [titik koma Cina], tanpa titik koma setelah kata kunci terakhir
(1) Program akan menghasilkan folder dengan保存文件名_当日日期
di direktori lokasi penyimpanan file yang dipilih, dan menyimpan konten yang dirayapi di folder ini
(2) Isi folder raw
adalah file cache yang dihasilkan selama proses perayapan dan dapat dihapus.