ears_dataset
blind testset
Wir veröffentlichen den Datensatz „ E xpressive A nechoic Recordings of S peech“ (EARS).
Wenn Sie den Datensatz oder ein Derivat davon verwenden, zitieren Sie bitte unser Papier
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
Für Audiobeispiele oder Skripte zur Generierung der Sprachverbesserungs-Benchmarks besuchen Sie bitte die Projektseite.
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
Führen Sie das EARS-Download-Skript aus
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
Führen Sie das Blind-Testset-Download-Skript aus
python download_blind_testset.py
Die Sprecherstatistiken (Alter, ethnische Zugehörigkeit, Geschlecht, Gewicht, Größe, Muttersprache) für die 107 Sprecher werden in Speaker_statistics.json gesammelt.
Transkripte der gelesenen Teile des Datensatzes sind in transcripts.json verfügbar.
Der Code und der Datensatz werden unter der CC-NC 4.0 International-Lizenz veröffentlicht.