ears_dataset Скачать - ears_dataset Загрузка исходного кода

ears_dataset

Другой исходный код

blind testset

Скачать

Набор данных EARS

Мы выпускаем набор данных « Экспрессивные анэхогенные записи речи » (EARS).

Если вы используете набор данных или любую его производную, пожалуйста, цитируйте нашу статью.

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

Образцы аудио или сценарии для создания тестов улучшения речи можно найти на странице проекта.

Основные моменты

100 часов речевых данных от 107 динамиков
высококачественная запись на частоте 48 кГц в безэховой камере
большое разнообразие говорящих : говорящие разных национальностей и возрастного диапазона от 18 до 75 лет
полный динамический диапазон человеческой речи: от шепота до крика
18 минут монологов в произвольной форме на каждого докладчика
Чтение предложений в 7 различных стилях чтения (обычное, громкое, шепотом, высоким, низким, быстрым, медленным)
Эмоциональное чтение и задания в произвольной форме, охватывающие 22 различные эмоции для каждого говорящего.

Скачать набор данных EARS

используя Баш

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

используя питон

запустите скрипт загрузки EARS

 python download_ears.py

Скачать слепой тестовый набор с шумной речью

используя Баш

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip