이 프로젝트는 https://github.com/Spritualkb/yuque-spider-plus/ 프로젝트를 기반으로 수정되었습니다.
Yuque 문서 크롤링 도구(크롤러)는 모든 사용자의 전체 Yuque 지식 기반을 Markdown 형식(전체 디렉터리 구조 및 색인 포함)으로 저장할 수 있습니다. 이는 존재하지 않는 경로를 발생시키는 파일 이름의 특수 문자 문제를 해결합니다.
사용: python3 설치
https://www.python.org/downloads/
설치 실행 및 모듈 실행
pip install requests tqdm urllib3
크롤링을 실행합니다.
python3 main.py 语雀文档地址
데모: python3 main.py https://www.yuque.com/burpheart/phpaudit
在没有登录语雀的情况下:
复制别人知识库时,查看cookie
在登录语雀的情况下:
直接复制所有cookie
명령줄
예시 1: URL 및 쿠키 제공
python main.py " https://www.yuque.com/burpheart/phpaudit " --cookie " verified_books=**** "
예시 2: URL, 쿠키 및 출력 경로 제공
python main . py "https://www.yuque.com/burpheart/phpaudit" - - cookie "verified_books=****" - - output "download"
예시 3: URL만 제공
python main.py " https://www.yuque.com/burpheart/phpaudit "
예시 4: URL 및 출력 경로 제공
python main.py " https://www.yuque.com/burpheart/phpaudit " --output " download "
예 5: 기본 매개변수 사용(도움말 정보 표시)
python main.py
일부 이미지를 로컬로 로드할 수 없는 문제를 해결하려면 네트워크 이미지를 다운로드하고 마크다운에 해당하는 이미지 경로를 상대 경로 ./assets 경로로 바꾸세요.