Unduh novel di situs web https://www.po18.tw sebagai dokumen txt.
Situs web ini tidak dapat diakses di daratan Cina dan proxy harus digunakan.
Hanya dapatkan konten bab gratis/dibeli. Silakan beli bab yang dibayar secara manual terlebih dahulu.
Lingkungan Pengembangan: Python 3.7
reference.py
demo pengunduh novel PO18 (Python 2.7).
Beautifulsoup
Permintaan
lxml
Pertama temukan ID buku (string angka setelah url /books/
) dan tetapkan ke book_number
.
Temukan jumlah total konten bab (lihat [empat digit] dalam bab sebelumnya dalam bab terbaru di direktori, atau lihat dari狀態未完結(目前xxx章回)
), dan tetapkan ke chapter_sum
.
Anda hanya dapat mengakses halaman baru setelah masuk, dan menetapkan account
dan pwd
di login()
sebagai informasi akun nyata Anda (informasi ini ada secara lokal dan hanya akan dikirim ke server PO18 untuk login).
Ubah txt = open('路径' + book_number + '.txt', 'a')
, temukan jalur folder, dan ganti karakter Cina.
login()
-> data{}
client_ip
diganti dengan IP asli sendiri (cara memeriksa IP, jangan tanya saya). Jika Anda menggunakan skrip ini secukupnya, server situs web tidak akan menanggapi IP yang terlalu sering diakses.
Jika situs web melaporkan kesalahan, temukan output baris perintah terakhir xx https://www.po18.tw/books/---/articles/----- processing...
, tetapkan nomor xx
untuk start
.
Di sini Anda biasanya perlu memodifikasi parameter page
di getContent(page)
dan menghitungnya sendiri.
Rerun dan unduhan akan berlanjut. (Posting ini dapat diulang beberapa kali)