BookTubeSpeech download
1.0.0
Это скрипт, который загружает WAV-файлы набора данных BookTubeSpeech.
Установите pytube3: pip3 install pytube3 --upgrade
У вас должен быть ffmpeg
для конвертации mp4 в wav.
У вас должен быть sox
для понижения разрешения wav-файла.
python3 download_data.py --output_dir=/path_to_download_dir
Некоторые видео могли стать недоступными с момента публикации оригинальной статьи, например, были удалены автором.
По состоянию на 20.04.2020 этот скрипт может успешно загрузить 8021 (из 8450) WAV-файлов.