Nous publions l’ensemble de données E xpressive A nechoic Recordings of S peech (EARS).
Si vous utilisez l'ensemble de données ou tout dérivé de celui-ci, veuillez citer notre article
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
Pour obtenir des échantillons audio ou des scripts permettant de générer les critères d'amélioration de la parole, veuillez visiter la page du projet.
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
exécutez le script de téléchargement EARS
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
exécuter le script de téléchargement de l'ensemble de tests aveugles
python download_blind_testset.py
Les statistiques des locuteurs (âge, origine ethnique, sexe, poids, taille, langue maternelle) des 107 locuteurs sont collectées dans speaker_statistics.json.
Les transcriptions des parties de lecture de l'ensemble de données sont disponibles dans transcripts.json.
Le code et l'ensemble de données sont publiés sous licence internationale CC-NC 4.0.