BookTubeSpeech download
1.0.0
これは、BookTubeSpeech データセットの WAV ファイルをダウンロードするスクリプトです。
pytube3 をインストールします: pip3 install pytube3 --upgrade
mp4をwavに変換するにはffmpeg
が必要です
wav ファイルをダウンサンプリングするにはsox
が必要です
python3 download_data.py --output_dir=/path_to_download_dir
一部のビデオは、元の論文の出版以降、作成者によって削除されたなど、利用できなくなっている可能性があります。
2020.04.20 の時点で、このスクリプトは 8,450 個中 8,021 個の WAV ファイルを正常にダウンロードできます。