Este proyecto está modificado en base al proyecto https://github.com/Spritualkb/yuque-spider-plus/
La herramienta de rastreo de documentos Yuque (rastreador) puede guardar toda la base de conocimientos de Yuque de cualquier usuario en formato Markdown (incluida la estructura completa del directorio y el índice). Soluciona el problema de los caracteres especiales en los nombres de archivos que causan rutas inexistentes.
Uso: instalar python3
https://www.python.org/downloads/
Ejecute la instalación y ejecute el módulo.
pip install requests tqdm urllib3
Ejecute el rastreo:
python3 main.py 语雀文档地址
demostración: python3 main.py https://www.yuque.com/burpheart/phpaudit
在没有登录语雀的情况下:
复制别人知识库时,查看cookie
在登录语雀的情况下:
直接复制所有cookie
línea de comando
Ejemplo 1: proporcionar URL y cookie
python main.py " https://www.yuque.com/burpheart/phpaudit " --cookie " verified_books=**** "
Ejemplo 2: proporcionar URL, cookie y ruta de salida
python main . py "https://www.yuque.com/burpheart/phpaudit" - - cookie "verified_books=****" - - output "download"
Ejemplo 3: proporcionar solo URL
python main.py " https://www.yuque.com/burpheart/phpaudit "
Ejemplo 4: proporcionar URL y ruta de salida
python main.py " https://www.yuque.com/burpheart/phpaudit " --output " download "
Ejemplo 5: utilizar parámetros predeterminados (mostrar información de ayuda)
python main.py
Para solucionar el problema de que algunas imágenes no se pueden cargar localmente, descargue las imágenes de red y reemplace la ruta de la imagen correspondiente a Markdown con la ruta relativa ./assets.