ดาวน์โหลด ears_dataset - ดาวน์โหลด ears

ears_dataset

ซอร์สโค้ดอื่น ๆ

blind testset

ดาวน์โหลด

ชุดข้อมูล EARS

เราเผยแพร่ชุดข้อมูล E xpressive A nechoic R ของชุดข้อมูล S peech (EARS)

หากคุณใช้ชุดข้อมูลหรืออนุพันธ์ใดๆ ของชุดข้อมูล โปรดอ้างอิงเอกสารของเรา

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

สำหรับตัวอย่างเสียงหรือสคริปต์เพื่อสร้างเกณฑ์มาตรฐานการปรับปรุงคำพูด โปรดไปที่หน้าโครงการ

ไฮไลท์

ข้อมูลเสียงพูด 100 ชั่วโมง จาก ลำโพง 107 ตัว
การบันทึกคุณภาพสูงที่ 48 kHz ในห้องไร้เสียงสะท้อน
ความหลากหลายของวิทยากรระดับสูง โดยวิทยากรจากหลากหลายเชื้อชาติและช่วงอายุตั้งแต่ 18 ถึง 75 ปี
ช่วงไดนามิกเต็มรูปแบบ ของคำพูดของมนุษย์ ตั้งแต่เสียงกระซิบไปจนถึงเสียงตะโกน
บทพูดเดี่ยวรูปแบบอิสระ 18 นาทีต่อวิทยากร
การอ่านประโยคใน รูปแบบการอ่านที่แตกต่างกัน 7 แบบ (ปกติ, ดัง, กระซิบ, เสียงสูง, เสียงต่ำ, เร็ว, ช้า)
การอ่านอารมณ์และงานอิสระครอบคลุม 22 อารมณ์ที่แตกต่างกัน สำหรับผู้พูดแต่ละคน

ดาวน์โหลดชุดข้อมูล EARS

ใช้ทุบตี

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

ใช้หลาม

รันสคริปต์ดาวน์โหลด EARS

 python download_ears.py

ดาวน์โหลด Blind Testset พร้อม Noisy Speech

ใช้ทุบตี

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip