ears_dataset下载 - ears_dataset源代码下载

ears_dataset

其他源码

blind testset

下载

EARS数据集

我们发布了表达性无回声语音记录 (EARS) 数据集。

如果您使用该数据集或其任何衍生物，请引用我们的论文

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

如需生成语音增强基准的音频样本或脚本，请访问项目页面。

亮点

107 位说话人的100 小时语音数据
在消声室中以48 kHz进行高质量录音
演讲者的多样性很高，演讲者来自不同种族，年龄范围为 18 至 75 岁
人类语音的全动态范围，从耳语到大喊
每位演讲者 18 分钟自由独白
7种不同阅读风格的句子阅读（常规、大声、耳语、高音、低音、快、慢）
情感阅读和自由形式任务，涵盖每位演讲者22 种不同的情感

下载 EARS 数据集

使用bash

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

使用Python

运行 EARS 下载脚本

 python download_ears.py

下载带有嘈杂语音的盲测试集

使用bash

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip