BookTubeSpeech download
1.0.0
Este é um script que baixa os arquivos WAV do conjunto de dados BookTubeSpeech.
Instale o pytube3: pip3 install pytube3 --upgrade
Você deve ter ffmpeg
para converter mp4 em wav
Você deve ter sox
para reduzir a resolução do arquivo wav
python3 download_data.py --output_dir=/path_to_download_dir
Alguns vídeos podem ter ficado indisponíveis desde a publicação do artigo original, por exemplo, excluídos pelo criador.
A partir de 2020.04.20, este script pode baixar 8.021 (de 8.450) arquivos WAV com êxito.