グダウン
5.2.0
Curl/Wget が失敗した場合の Google ドライブ パブリック ファイル ダウンローダー
Gdown は、 Google ドライブからパブリック ファイル/フォルダーをダウンロードします。
Gdown は、 curl/wget にはない Google ドライブの機能を提供します。
大きなファイルのダウンロードを許可するセキュリティ通知をスキップします(curl/wget は失敗します)。
フォルダー内のファイルの再帰的ダウンロード(フォルダーごとに最大 50 ファイル)。
Google スライド/シート/ドキュメントのダウンロード ファイル形式 (PDF/XML/CSV など) を指定します。
pip install gdown# アップグレードするにはpip install --upgrade gdown
$ gdown --ヘルプ 使用法: gdown [-h] [-V] [-O OUTPUT] [-q] [--fuzzy] [--id] [--proxy PROXY] [--speed SPEED] [--no-cookies] [--no-check-certificate] [--続行] [--フォルダー] [--残りOK] URL または ID ... $ # 大きなファイル (~500MB)$ gdown https://drive.google.com/uc?id=1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ $ md5sum fcn8s_from_caffe.npz 256c2a8235c1c65e62e48d3284fbd384 $ # 上記と同じですが、ファイル ID は $ gdown 1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ $ # 小さなファイル$ gdown https://drive.google.com/uc?id=0B9P1L--7Wd2vU3VUVlFnbTgtS2c $ 猫スパム.txt スパム $ # ファイル ID のあいまい抽出を使用してダウンロード$ gdown --fuzzy 'https://drive.google.com/file/d/0B9P1L--7Wd2vU3VUVlFnbTgtS2c/view?usp=sharing&resourcekey=0-WWs_XOSctfaY_0-sJBKRSQ'$ 猫スパム。TXT スパム $ # --fuzzy オプションは Microsoft Powerpoint ファイルでも機能します$ gdown --fuzzy "https://docs.google.com/presentation/d/15umvZKlsJ3094HNg5S4vJsIhxcFlyTeK/edit?usp=sharing&ouid=117512221203072002113&rtpof=true&sd=true"$ # フォルダー$ gdown https://drive.google.com/drive/folders/15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl -O /tmp/folder --folder $ #curl/wget$ gdown の代替として https://httpbin.org/ip -O ip.json $猫ip.json { "原点": "126.169.213.247"} $ # stdout を書き込み、extract にパイプします。 $ gdown https://github.com/wkentaro/gdown/archive/refs/tags/v4.0.0.tar.gz -O - --quiet |タールzxvf - $ ls gdown-4.0.0/ gdown github2pypi LICENSE MANIFEST.in pyproject.toml README.md setup.cfg setup.py テスト
import gdown# a fileurl = "https://drive.google.com/uc?id=1l_5RK28JRL19wpT22B-DY9We3TVXnnQQ"output = "fcn8s_from_caffe.npz"gdown.download(url,output)# 上記と同じですが、ファイルを使用しますIDid = "0B9P1L--7Wd2vNm9zMTJWOGxobkU"gdown.download(id=id, Output=output)# 上記と同じで、fuzzy=Trueurl = を指定すると、Google ドライブから URL をコピーして貼り付けることができます。 "https://drive.google.com/file/d/0B9P1L--7Wd2vNm9zMTJWOGxobkU/view?usp=sharing"gdown.download(url=url, Output=output, fuzzy=True)# MD5 による ID チェックを使用したキャッシュされたダウンロード(または SHA1、SHA256 など)。# 後処理関数を渡します (例: 圧縮ファイルの解凍)。md5 = "md5:fa837a88f0c40c513d975104edf3da17"gdown.cached_download(url, 出力, ハッシュ=ハッシュ, postprocess=gdown.extractall)# a フォルダーurl = "https://drive.google.com/drive/folders/15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl"gdown.download_folder(url)# 上記と同じですが、フォルダー IDid = "15uNXeRBIhVvZJIhL4yTw4IsStMhUaaxl"gdown.download_folder(id=id) になります。
ファイル権限を「リンクを知っている人」に設定していることを確認しましたか?
ダウンロードが集中すると、Google はファイルへのアクセスを制限します。まだブラウザからファイルにアクセスできる場合は、Cookie ファイルをダウンロードすると解決する可能性があります。次の手順に従ってください: 1) (Cookie.txt をローカルで取得) などのブラウザ拡張機能を使用して cookies.txt をダウンロードします。 2) cookies.txt
~/.cache/gdown/cookies.txt
に mv します。 3) ダウンロードを再度実行します。 gdown>=5.0.0
を使用している場合は、ブラウザと同じ Cookie を使用できるはずです。