Ears_dataset تنزيل -ears_dataset تنزيل كود المصدر

Ears_dataset

شفرة المصدر الأخرى

blind testset

تنزيل

مجموعة بيانات EARS

قمنا بإصدار تسجيلات E Expressive A nechoic R لمجموعة بيانات S peech (EARS).

إذا كنت تستخدم مجموعة البيانات أو أي مشتق منها، فيرجى الاستشهاد بورقتنا البحثية

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

للحصول على عينات صوتية أو نصوص برمجية لإنشاء معايير تحسين الكلام، يرجى زيارة صفحة المشروع.

أبرز

100 ساعة من بيانات الكلام من 107 متحدثين
تسجيلات عالية الجودة عند 48 كيلو هرتز في غرفة كاتمة للصدى
تنوع كبير في المتحدثين مع متحدثين من أعراق مختلفة وتتراوح أعمارهم من 18 إلى 75 عامًا
النطاق الديناميكي الكامل للكلام البشري، بدءًا من الهمس وحتى الصراخ
18 دقيقة من المونولوجات الحرة لكل متحدث
قراءة الجملة في 7 أنماط قراءة مختلفة (العادية، بصوت عال، الهمس، درجة عالية، درجة منخفضة، سريع، بطيء)
القراءة العاطفية والمهام الحرة التي تغطي 22 عاطفة مختلفة لكل متحدث

قم بتنزيل مجموعة بيانات EARS

باستخدام باش

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

باستخدام بايثون

قم بتشغيل البرنامج النصي لتنزيل EARS

 python download_ears.py

قم بتنزيل اختبار المكفوفين مع الكلام الصاخب

باستخدام باش

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip