BookTubeSpeech download
1.0.0
BookTubeSpeech 데이터세트의 WAV 파일을 다운로드하는 스크립트입니다.
pytube3 설치: pip3 install pytube3 --upgrade
mp4를 wav로 변환하려면 ffmpeg
있어야 합니다.
wav 파일을 다운샘플링하려면 sox
있어야 합니다.
python3 download_data.py --output_dir=/path_to_download_dir
일부 비디오는 원본 논문이 출판된 이후 작성자에 의해 삭제되는 등 사용이 불가능할 수 있습니다.
2020.04.20 기준으로 이 스크립트는 8021개(8450개 중)의 WAV 파일을 성공적으로 다운로드할 수 있습니다.