耳朵數據集
blind testset
我們發布了表達性無迴聲語音記錄 (EARS) 資料集。
如果您使用該資料集或其任何衍生物,請引用我們的論文
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
如需產生語音增強基準的音訊樣本或腳本,請造訪專案頁面。
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
執行 EARS 下載腳本
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
執行盲測試集下載腳本
python download_blind_testset.py
107 位說話者的說話者統計資料(年齡、種族、性別、體重、身高、母語)收集在揚聲器_statistics.json 中。
資料集閱讀部分的抄本可在transcripts.json 中找到。
代碼和資料集在 CC-NC 4.0 國際許可下發布。