Ce projet est modifié en fonction du projet https://github.com/Spritualkb/yuque-spider-plus/
L'outil d'exploration de documents Yuque (crawler) peut enregistrer l'intégralité de la base de connaissances Yuque de n'importe quel utilisateur au format Markdown (y compris la structure complète des répertoires et l'index). Il résout le problème des caractères spéciaux dans les noms de fichiers provoquant des chemins inexistants.
Utilisation : installer python3
https://www.python.org/downloads/
Exécuter l'installation et exécuter le module
pip install requests tqdm urllib3
Exécutez l'exploration :
python3 main.py 语雀文档地址
démo : python3 main.py https://www.yuque.com/burpheart/phpaudit
在没有登录语雀的情况下:
复制别人知识库时,查看cookie
在登录语雀的情况下:
直接复制所有cookie
ligne de commande
Exemple 1 : Fournissez l'URL et le cookie
python main.py " https://www.yuque.com/burpheart/phpaudit " --cookie " verified_books=**** "
Exemple 2 : Fournissez l'URL, le cookie et le chemin de sortie
python main . py "https://www.yuque.com/burpheart/phpaudit" - - cookie "verified_books=****" - - output "download"
Exemple 3 : Fournissez l'URL uniquement
python main.py " https://www.yuque.com/burpheart/phpaudit "
Exemple 4 : Fournissez l'URL et le chemin de sortie
python main.py " https://www.yuque.com/burpheart/phpaudit " --output " download "
Exemple 5 : Utiliser les paramètres par défaut (afficher les informations d'aide)
python main.py
Pour résoudre le problème selon lequel certaines images ne peuvent pas être chargées localement, téléchargez les images réseau et remplacez le chemin de l'image correspondant au démarque par le chemin relatif ./assets path.