Faça o download do romance no site https://www.po18.tw como um documento TXT.
Este site não pode ser acessado na China continental e um proxy deve ser usado.
Obtenha apenas conteúdo gratuito/comprado do capítulo. Por favor, compre o capítulo pago manualmente primeiro.
Ambiente de Desenvolvimento: Python 3.7
reference.py
a demonstração do romance PO18 (Python 2.7).
Belo grupo
Solicitações
lxml
Primeiro encontre o ID do livro (a sequência de números após o URL /books/
) e atribua -o ao book_number
.
Encontre o número total de conteúdo do capítulo (consulte os [quatro dígitos] no capítulo anterior no capítulo mais recente do diretório, ou veja do狀態未完結(目前xxx章回)
) e atribui -o ao chapter_sum
.
Você só pode acessar a página do romance após o login e atribuir account
e pwd
no login()
como informações da sua conta real (essas informações existem localmente e serão enviadas apenas ao servidor PO18 para login).
Alterar txt = open('路径' + book_number + '.txt', 'a')
, encontre um caminho de pasta e substitua os caracteres chineses.
login()
-> data{}
's client_ip
é substituído por seu próprio IP nativo (como verificar o IP, não me pergunte). Se você usar esse script com moderação, o servidor do site não responderá aos IPs que são acessados com muita frequência.
Se o site relatar um erro, encontre a última linha de comando em saída xx https://www.po18.tw/books/---/articles/----- processing...
, atribua o número xx
para start
.
Aqui você geralmente precisa modificar os parâmetros page
no getContent(page)
e calcule você mesmo.
Reencontrar e o download continuará. (Esta postagem pode ser repetida várias vezes)