Lanzamos el conjunto de datos de Grabaciones anecoicas expresivas del habla (EARS).
Si utiliza el conjunto de datos o cualquier derivado del mismo, cite nuestro documento
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
Para obtener muestras de audio o guiones para generar puntos de referencia de mejora del habla, visite la página del proyecto.
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
ejecute el script de descarga de EARS
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
ejecutar el script de descarga del conjunto de pruebas ciegas
python download_blind_testset.py
Las estadísticas de los hablantes (edad, origen étnico, sexo, peso, altura, idioma nativo) de los 107 hablantes se recopilan en Speaker_statistics.json.
Las transcripciones de las partes de lectura del conjunto de datos están disponibles en transcripts.json.
El código y el conjunto de datos se publican bajo la licencia internacional CC-NC 4.0.