ears_dataset下載 - ears_dataset原始碼下載

ears_dataset

其他源碼

blind testset

下載

EARS資料集

我們發布了表達性無迴聲語音記錄 (EARS) 資料集。

如果您使用該資料集或其任何衍生物，請引用我們的論文

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

如需產生語音增強基準的音訊樣本或腳本，請造訪專案頁面。

亮點

107 位說話者的100 小時語音數據
在消音室中以48 kHz進行高品質錄音
演講者的多樣性很高，演講者來自不同種族，年齡範圍為 18 至 75 歲
人類語音的全動態範圍，從耳語到大喊
每位演講者 18 分鐘自由獨白
7種不同閱讀風格的句子閱讀（常規、大聲、耳語、高音、低音、快、慢）
情感閱讀與自由形式任務，涵蓋每位演講者22 種不同的情感

下載 EARS 資料集

使用bash

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

使用Python

執行 EARS 下載腳本

 python download_ears.py

下載帶有嘈雜語音的盲測試集

使用bash

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip