MockingBird는 음성을 복제하고 임의의 음성 콘텐츠를 생성할 수 있는 AI 의성어 시스템입니다.
특성
1. 텍스트는 중국어를 지원하며 aidatatang_200zh, Magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 등 다양한 중국어 데이터 세트를 사용하여 테스트되었습니다.
2. PyTorch는 pytorch에 적합하며 1.9.0(최신 2021년 8월), GPU Tesla T4 및 GTX 2060에서 테스트되었습니다.
3. Windows + Linux는 Windows 운영 체제 및 Linux 운영 체제에서 실행할 수 있습니다. (Apple 시스템 M1 버전에도 성공적인 커뮤니티 운영 사례가 있습니다.)
4. 쉽고 최고입니다. 좋은 결과를 얻으려면 신디사이저(신디사이저)를 다운로드하거나 새로 훈련시키거나, 사전 훈련된 인코더/보코더를 재사용하거나, 실시간 HiFi-GAN을 보코더로 재사용하세요.
5. Webserver Ready는 원격 통화를 위한 훈련 결과를 제공할 수 있습니다.
시작
설치 요구 사항
원본 저장소를 따라 모든 환경이 준비되었는지 테스트하세요. 툴박스를 실행하려면 Python 3.7 이상이 필요합니다.
PyTorch를 설치합니다.
pip로 설치할 때 오류: 요구사항을 충족하는 버전을 찾을 수 없습니다. torch==1.9.0+cu102(버전: 0.1.2, 0.1.2.post1, 0.1.2.post2)가 발생하는 경우 Python일 수 있습니다. 너무 낮습니다. 3.9를 성공적으로 설치할 수 있습니다.
ffmpeg를 설치하세요.
pip install -r 요구 사항.txt를 실행하여 나머지 필수 패키지를 설치합니다.
webrtcvad pip를 설치하여 webrtcvad-wheels를 설치합니다.