Ears_ชุดข้อมูล
blind testset
เราเผยแพร่ชุดข้อมูล E xpressive A nechoic R ของชุดข้อมูล S peech (EARS)
หากคุณใช้ชุดข้อมูลหรืออนุพันธ์ใดๆ ของชุดข้อมูล โปรดอ้างอิงเอกสารของเรา
@inproceedings{richter2024ears,
title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
booktitle={Interspeech},
year={2024}
}
สำหรับตัวอย่างเสียงหรือสคริปต์เพื่อสร้างเกณฑ์มาตรฐานการปรับปรุงคำพูด โปรดไปที่หน้าโครงการ
for X in $(seq -w 001 107); do
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
unzip p${X}.zip
rm p${X}.zip
done
รันสคริปต์ดาวน์โหลด EARS
python download_ears.py
curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip
รันสคริปต์ดาวน์โหลด blind testset
python download_blind_testset.py
สถิติของผู้พูด (อายุ ชาติพันธุ์ เพศ น้ำหนัก ส่วนสูง ภาษาแม่) ของผู้พูด 107 คนได้รับการรวบรวมไว้ใน speaker_statistics.json
การถอดเสียงของส่วนการอ่านของชุดข้อมูลมีอยู่ใน transcripts.json
รหัสและชุดข้อมูลเผยแพร่ภายใต้ใบอนุญาต CC-NC 4.0 International