Téléchargeur de fichiers publics Google Drive en cas d'échec de Curl/Wget
Gdown télécharge un fichier/dossier public depuis Google Drive.
Gdown fournit ce que curl/wget ne fait pas pour Google Drive :
Ignorez l'avis de sécurité vous permettant de télécharger des fichiers volumineux (échec de curl/wget) ;
Téléchargement récursif de fichiers dans un dossier (maximum 50 fichiers par dossier) ;
Spécifiez le format de fichier de téléchargement pour Google Slides/Sheet/Docs comme PDF/XML/CSV.
pip install gdown# pour mettre à niveaupip install --upgrade gdown
$ gdown --aide utilisation : gdown [-h] [-V] [-O OUTPUT] [-q] [--fuzzy] [--id] [--proxy PROXY] [--speed SPEED] [--no-cookies] [--no-check-certificate] [--continue] [--folder] [--remaining-ok] url_or_id ... $ # un gros fichier (~ 500 Mo)$ gdown https://drive.google.com/uc?id=1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ $ somme md5 fcn8s_from_caffe.npz 256c2a8235c1c65e62e48d3284fbd384 $ # identique à ci-dessus mais avec l'ID de fichier$ gdown 1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ $ # un petit fichier$ gdown https://drive.google.com/uc?id=0B9P1L--7Wd2vU3VUVlFnbTgtS2c $ chat spam.txt courrier indésirable $ # téléchargement avec extraction floue d'un ID de fichier$ gdown --fuzzy 'https://drive.google.com/file/d/0B9P1L--7Wd2vU3VUVlFnbTgtS2c/view?usp=sharing&resourcekey=0-WWs_XOSctfaY_0-sJBKRSQ'$ cat spam .SMS courrier indésirable $ # --fuzzy l'option fonctionne également avec les fichiers Microsoft Powerpoint$ gdown --fuzzy "https://docs.google.com/presentation/d/15umvZKlsJ3094HNg5S4vJsIhxcFlyTeK/edit?usp=sharing&ouid=117512221203072002113&rtpof=true&sd=true"$ # un dossier $ gdown https://drive.google.com/drive/folders/15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl -O /tmp/folder --folder $ # comme alternative à curl/wget$ gdown https://httpbin.org/ip -O ip.json $ cat ip.json { "origine": "126.169.213.247"} $ # écrivez la sortie standard et le tube pour extraire $ gdown https://github.com/wkentaro/gdown/archive/refs/tags/v4.0.0.tar.gz -O - --quiet | tar zxvf - $ ls gdown-4.0.0/ gdown github2pypi MANIFESTE DE LICENCE.in pyproject.toml README.md setup.cfg setup.py tests
import gdown# a filurl = "https://drive.google.com/uc?id=1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ"output = "fcn8s_from_caffe.npz"gdown.download(url, output)# identique à ci-dessus, mais avec le fichier IDid = "0B9P1L--7Wd2vNm9zMTJWOGxobkU"gdown.download(id=id, output=output)# identique à celui ci-dessus, et vous pouvez copier-coller une URL depuis Google Drive avec fuzzy=Trueurl = "https://drive .google.com/file/d/0B9P1L--7Wd2vNm9zMTJWOGxobkU/view?usp=sharing"gdown.download(url=url, output=output, fuzzy=True)# Téléchargement en cache avec vérification d'identité via MD5 (ou SHA1, SHA256, etc).# Passer la fonction de post-traitement, par exemple, extraire un fichier compressé.md5 = "md5:fa837a88f0c40c513d975104edf3da17"gdown.cached_download(url, output, hash=hash, postprocess=gdown.extractall)# a dossierurl = "https://drive.google .com/drive/folders/15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl"gdown.download_folder(url)# identique à ci-dessus, mais avec le dossier IDid = "15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl"gdown.download_folder(id=id)
Avez-vous veillé à définir l'autorisation de fichier sur « Toute personne disposant d'un lien » ?
Google restreint l'accès à un fichier lorsque le téléchargement est concentré. Si vous pouvez toujours accéder au fichier depuis votre navigateur, le téléchargement du fichier cookies peut être utile. Suivez cette étape : 1) téléchargez cookies.txt à l'aide d'extensions de navigateur telles que (Obtenir cookies.txt LOCALEMENT) ; 2) mv le cookies.txt
vers ~/.cache/gdown/cookies.txt
; 3) relancez le téléchargement. Si vous utilisez gdown>=5.0.0
, il devrait pouvoir utiliser les cookies de la même manière que votre navigateur.