https://www.po18.tw 웹 사이트에서 소설을 TXT 문서로 다운로드하십시오.
이 웹 사이트는 중국 본토에서 액세스 할 수 없으며 프록시를 사용해야합니다.
무료/구매 한 장 콘텐츠 만 받으십시오. 먼저 유료 장을 수동으로 구입하십시오.
개발 환경 : 파이썬 3.7
PO18 소설 다운로더 데모 (Python 2.7)를 reference.py
하십시오.
BeautifulSoup
요청
LXML
먼저 책 ID (URL /books/
이후의 숫자 문자열)를 찾아서 book_number
에 할당하십시오.
총 챕터 컨텐츠 수 (디렉토리의 최신 장의 이전 장에서 [4 자리] 참조를 찾거나狀態未完結(目前xxx章回)
)를 확인하고 chapter_sum
에 할당하십시오.
로그인 한 후에 만 소설 페이지에 액세스하고 실제 계정 정보로 login()
에 account
및 pwd
할당 할 수 있습니다 (이 정보는 로컬에서 존재하며 로그인을 위해 PO18 서버로만 전송됩니다).
txt = open('路径' + book_number + '.txt', 'a')
변경하고 폴더 경로를 찾은 다음 중국어를 교체하십시오.
login()
-> data{}
의 client_ip
자체 기본 IP로 대체됩니다 (IP를 확인하는 방법, 묻지 마십시오). 이 스크립트를 적당히 사용하는 경우 웹 사이트 서버는 너무 자주 액세스하는 IP에 응답하지 않습니다.
웹 사이트에 오류가보고되면 마지막 명령 줄 start
xx
xx https://www.po18.tw/books/---/articles/----- processing...
여기에서 일반적으로 getContent(page)
에서 page
매개 변수를 수정하고 직접 계산해야합니다.
재실행하면 다운로드가 계속됩니다. (이 게시물은 여러 번 반복 될 수 있습니다)