unduhan ears_dataset - unduhan kode sumber ears

ears_dataset

Kode sumber lainnya

blind testset

Unduh

Kumpulan Data TELINGA

Kami merilis kumpulan data E xpressive A nechoic R ecodings of S peech (EARS).

Jika Anda menggunakan kumpulan data atau turunannya, harap kutip Makalah kami

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

Untuk sampel audio atau skrip untuk menghasilkan tolok ukur peningkatan kemampuan bicara, silakan kunjungi halaman proyek.

Highlight

100 jam data ucapan dari 107 pembicara
rekaman berkualitas tinggi pada 48 kHz di ruang anechoic
keragaman penutur yang tinggi dengan penutur dari berbagai etnis dan rentang usia 18 hingga 75 tahun
rentang dinamis penuh ucapan manusia, mulai dari berbisik hingga berteriak
Monolog bentuk bebas selama 18 menit per pembicara
membaca kalimat dalam 7 gaya membaca berbeda (reguler, keras, berbisik, nada tinggi, nada rendah, cepat, lambat)
pembacaan emosional dan tugas bentuk bebas yang mencakup 22 emosi berbeda untuk setiap pembicara

Unduh Kumpulan Data EARS

menggunakan pesta

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

menggunakan python

jalankan skrip unduhan EARS

 python download_ears.py

Unduh Blind Testset dengan Ucapan Bising

menggunakan pesta

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip