Download ears_dataset - download do código fonte ears

ears_dataset

Outro código-fonte

blind testset

Baixar

Conjunto de dados EARS

Lançamos o conjunto de dados Expressive A nechoic Recordings of Speech (EARS).

Se você usar o conjunto de dados ou qualquer derivado dele, cite nosso artigo

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

Para amostras de áudio ou scripts para gerar benchmarks de aprimoramento de fala, visite a página do projeto.

Destaques

100 horas de dados de fala de 107 alto-falantes
gravações de alta qualidade a 48 kHz em uma câmara anecóica
alta diversidade de falantes com falantes de diferentes etnias e faixa etária de 18 a 75 anos
gama dinâmica completa da fala humana, desde sussurros até gritos
18 minutos de monólogos de formato livre por palestrante
leitura de frases em 7 estilos de leitura diferentes (regular, alto, sussurro, tom alto, tom baixo, rápido, lento)
leitura emocional e tarefas de formato livre cobrindo 22 emoções diferentes para cada palestrante

Baixe o conjunto de dados EARS

usando bash

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

usando python

execute o script de download do EARS

 python download_ears.py

Baixe o conjunto de testes cego com fala barulhenta

usando bash

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip