ears_dataset 다운로드 - ears_dataset 소스 코드 다운로드

ears_dataset

기타 소스코드

blind testset

다운로드

EARS 데이터세트

EARS( Expressive A Nechoic Recordings of Speech ) 데이터세트를 출시합니다.

데이터세트나 그 파생물을 사용하는 경우 당사의 논문을 인용해 주세요.

 @inproceedings{richter2024ears,
  title={{EARS}: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation},
  author={Richter, Julius and Wu, Yi-Chiao and Krenn, Steven and Welker, Simon and Lay, Bunlong and Watanabe, Shinjii and Richard, Alexander and Gerkmann, Timo},
  booktitle={Interspeech},
  year={2024}
}

음성 향상 벤치마크를 생성하기 위한 오디오 샘플이나 스크립트를 보려면 프로젝트 페이지를 방문하세요.

하이라이트

107명의 화자가 보낸 100시간 분량의 음성 데이터
무향실에서 48kHz 로 고품질 녹음
18세부터 75세까지 다양한 인종과 연령대의 화자로 구성된 높은 화자 다양성
속삭이는 것부터 고함을 지르는 것까지 인간 음성의 전체 동적 범위
발표자당 18분의 자유 형식 독백
7가지 읽기 스타일 로 문장 읽기(보통, 크게, 속삭임, 높은 음조, 낮은 음조, 빠르게, 느리게)
각 화자의 22가지 감정을 다루는 감정 읽기 및 자유 형식 작업

EARS 데이터세트 다운로드

배쉬를 사용하여

 for X in $(seq -w 001 107); do
  curl -L https://github.com/facebookresearch/ears_dataset/releases/download/dataset/p${X}.zip -o p${X}.zip
  unzip p${X}.zip
  rm p${X}.zip
done

파이썬을 사용하여

EARS 다운로드 스크립트 실행

 python download_ears.py

시끄러운 음성이 포함된 블라인드 테스트 세트 다운로드

배쉬를 사용하여

 curl -L https://github.com/facebookresearch/ears_dataset/releases/download/blind_testset/blind_testset.zip -o blind_testset.zip
mkdir blind_testset
unzip blind_testset.zip -d blind_testset
rm blind_testset.zip