ears_dataset
blind testset
우리는 EARS( Expressive A Nechoic Recordings of Speech ) 데이터세트를 출시합니다.
데이터세트나 그 파생물을 사용하는 경우 당사의 논문을 인용해 주세요.
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
음성 향상 벤치마크를 생성하기 위한 오디오 샘플이나 스크립트를 보려면 프로젝트 페이지를 방문하세요.
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
EARS 다운로드 스크립트 실행
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
블라인드 테스트 세트 다운로드 스크립트 실행
python download_blind_testset.py
107명의 화자에 대한 화자 통계(연령, 민족, 성별, 체중, 키, 모국어)는 Speaker_statistics.json에 수집됩니다.
데이터세트의 읽기 부분에 대한 성적표는 transcriptions.json에서 확인할 수 있습니다.
코드와 데이터 세트는 CC-NC 4.0 국제 라이센스에 따라 공개됩니다.