PO18 Novel Txt Downloader
1.0.0
将https://www.po18.tw 网站上的小说下载为txt 文档。
大陆地区无法访问此网站,须使用代理。
只能取得免费/ 已购章节内容。收费章节请先手动购买。
开发环境:Python 3.7
参考了po18 小说下载器demo(Python 2.7),原文仅提供示例函数,已略作整理copy 在本项目的reference.py
里。
BeautifulSoup
requests
lxml
先找到要下载的书籍ID(网址/books/
后面那串数字),赋值给book_number
。
找到章节内容总数(看目录里最新一章前面的【四位数字】,或者从狀態未完結(目前xxx章回)
这里看),赋值给chapter_sum
。
登录后才可访问小说页面,把login()
里的account
和pwd
赋值为自己的真实账号信息(此信息存在本地,只会发送给po18 的服务器登录用)。
更改txt = open('路径' + book_number + '.txt', 'a')
,随便找个文件夹路径,替换掉中文字符。
login()
-> data{}
的client_ip
换成自己的本机IP(怎么查IP 莫问我)。适度使用本脚本,网站服务器对访问过于频繁的IP 将无响应。
如果报错网站无响应,找到最后一次命令行输出xx https://www.po18.tw/books/---/articles/----- processing...
,把数字xx
赋值给start
。
这里通常还需要再修改一下getContent(page)
里的page
参,自己算算。
重新运行,就会继续下载。 (此条可能重复操作数次)