BookTubeSpeech download
1.0.0
这是一个下载 BookTubeSpeech 数据集的 WAV 文件的脚本。
安装 pytube3: pip3 install pytube3 --upgrade
您必须有ffmpeg
才能将 mp4 转换为 wav
您必须有sox
才能对 wav 文件进行下采样
python3 download_data.py --output_dir=/path_to_download_dir
自原始论文发表以来,某些视频可能已不可用,例如被创建者删除。
截至 2020 年 4 月 20 日,该脚本可以成功下载 8021 个(共 8450 个)WAV 文件。