耳のデータセット
blind testset
Expressive A nechoic Recordings of Speech (EARS) データセットをリリースします。
データセットまたはその派生物を使用する場合は、論文を引用してください。
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
音声強調ベンチマークを生成するためのオーディオ サンプルまたはスクリプトについては、プロジェクト ページを参照してください。
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
EARS ダウンロード スクリプトを実行する
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
ブラインド テストセット ダウンロード スクリプトを実行する
python download_blind_testset.py
107 人の話者の話者統計 (年齢、民族、性別、体重、身長、母国語) は、speaker_statistics.json に収集されます。
データセットの読み取り部分のトランスクリプトは、transscripts.json で入手できます。
コードとデータセットは、CC-NC 4.0 国際ライセンスに基づいてリリースされています。