MockingBird 실시간 음성복제 시스템 다운로드 - MockingBird 실시간 음성복제 시스템 v1.0 소스코드 다운로드

MockingBird 실시간 음성 복제 시스템 v1.0

파이썬

1.0

다운로드

MockingBird는 음성을 복제하고 임의의 음성 콘텐츠를 생성할 수 있는 AI 의성어 시스템입니다.

특성

1. 텍스트는 중국어를 지원하며 aidatatang_200zh, Magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 등 다양한 중국어 데이터 세트를 사용하여 테스트되었습니다.

2. PyTorch는 pytorch에 적합하며 1.9.0(최신 2021년 8월), GPU Tesla T4 및 GTX 2060에서 테스트되었습니다.

3. Windows + Linux는 Windows 운영 체제 및 Linux 운영 체제에서 실행할 수 있습니다. (Apple 시스템 M1 버전에도 성공적인 커뮤니티 운영 사례가 있습니다.)

4. 쉽고 최고입니다. 좋은 결과를 얻으려면 신디사이저(신디사이저)를 다운로드하거나 새로 훈련시키거나, 사전 훈련된 인코더/보코더를 재사용하거나, 실시간 HiFi-GAN을 보코더로 재사용하세요.

5. Webserver Ready는 원격 통화를 위한 훈련 결과를 제공할 수 있습니다.

시작

설치 요구 사항

원본 저장소를 따라 모든 환경이 준비되었는지 테스트하세요. 툴박스를 실행하려면 Python 3.7 이상이 필요합니다.

PyTorch를 설치합니다.

pip로 설치할 때 오류: 요구사항을 충족하는 버전을 찾을 수 없습니다. torch==1.9.0+cu102(버전: 0.1.2, 0.1.2.post1, 0.1.2.post2)가 발생하는 경우 Python일 수 있습니다. 너무 낮습니다. 3.9를 성공적으로 설치할 수 있습니다.

ffmpeg를 설치하세요.

pip install -r 요구 사항.txt를 실행하여 나머지 필수 패키지를 설치합니다.

webrtcvad pip를 설치하여 webrtcvad-wheels를 설치합니다.

확장하다

추가 정보