Awesome ChatTTS 다운로드 - Awesome ChatTTS 소스 코드 다운로드

Awesome ChatTTS

기타 소스코드

1.0.0

다운로드

굉장합니다 .webp

영어 |. 단순화

Awesome Chattts는 공식적으로 권장되는 Chattts Resource Summary 프로젝트입니다.

이 프로젝트가 Chattts를 이해하고 사용하는 데 도움이된다고 생각되면 보상과 지원을 해주세요.

메모

다음 프로젝트는 커뮤니티 리소스입니다.

공식 소개
빠른 경험
인기있는 지점
인터페이스 설명
톤 제어
시작하기 튜토리얼
자주 묻는 질문
오류를 빠르게 점검하십시오

공식 소개

차트 .-. 001 .-. chatts.mp4

빠른 경험

웹 사이트	유형
오리지널 웹	오리지널 웹 버전 경험
위조 웹	강화 된 에디션 경험을 위조하십시오
리눅스	파이썬 설치 패키지
샘플	톤 씨앗 예제
복제	톤 클로닝 경험

프로젝트	별	하이라이트
Jianchang512/Chattts-UI		타사 응용 프로그램에서 호출 할 수있는 API 인터페이스를 제공합니다.
6DRF21E/chattts_colab		스트리밍 출력 제공, 긴 오디오 생성 및 부품 문자 읽기를 지원합니다.
lenml/chattts-forge		추가 신속한 단어를 사용하여 보컬 향상 및 배경 노이즈 감소를 제공합니다.
ccmahua/chattts-enhanced		파일의 배치 처리 및 SRT 파일의 내보내기 지원
Hkoon/Chattts-Openvoice		OpenVoice로 사운드 클로닝

프로젝트	별	하이라이트
6DRF21E/chattts_speaker		톤 문자 표시 및 안정성 평가
aifsh/comfyui-chattts		워크 플로 노드로 소개 될 수있는 comfyui 버전
Materialshadow/Chattts-Manager		톤 관리 시스템 및 WebUI 인터페이스를 제공합니다

인터페이스 설명

구성 항목 설명

텍스트 제어

1. 입력 텍스트 : 변환 해야하는 텍스트, 혼합 중국어와 영어를 지원합니다.
2. 개선 텍스트 : 구어체 텍스트 사용 여부
3. 텍스트 종자 : 텍스트 종자 값을 구성하고 다른 씨앗은 다른 구어체 스타일에 해당합니다.
4.? : 텍스트 종자 값
5. 출력 텍스트 : 구어체 처리 후 생성 된 텍스트

톤 제어

6. Timbre : 사전 설정 톤 씨 값
7. 오디오 시드 : 톤 시드 값을 구성하고 다른 씨앗은 다른 색조에 해당합니다.
8.? : 무작위로 음색 종자 값
9. 스피커 임베딩 : 톤 코드, 자세한 내용은 톤 컨트롤 참조

정서적 통제

온도 : 0-1의 범위로 오디오 감정적 변동성을 제어합니다.
11. TOP_P : 오디오의 감정적 상관 관계를 제어하며, 범위는 0.1-0.9입니다.
12. TOP_K : 1-20의 범위로 오디오의 정서적 유사성을 제어합니다

계수 제어

13. DVAE 계수 : 모델 계수 코드
14 RELOAD : 모델 계수를 다시로드합니다

재생 제어

15. Auto Play : 생성 된 후 오디오를 자동으로 재생할지 여부
스트림 모드 : 스트리밍 출력 활성화 여부
17. 생성 : 오디오 파일을 생성하려면 클릭하십시오
18. 출력 오디오 : 오디오 생성 결과
19. ↓ : 클릭하여 오디오 파일을 다운로드하십시오
20. ▶ ️ : 클릭하여 오디오 파일을 재생하십시오

샘플 제어

21. 예 : 예제 구성을 전환하려면 클릭하십시오

톤 제어

실제 테스트 후, 지정된 톤 시드 값이 생성 될 때마다 spk_emb 생성하고 사전 생성 된 spk_emb .pt 하는 데 큰 차이가 있습니다.

톤 씨앗은 초기에 Chatts_speaker 프로젝트에서 표시되고 안정적인 평가되었으며 예제를 통해 올바른 톤을 빠르게 선택할 수 있습니다.

오디오 코드 .png

webui

공식 WebUI에서 사용될 때는 톤 코드를 직접 복사하고 9의 값을 9. Speaker Embedding 바꾸어 톤 제어를 달성 할 수 있습니다.

파이썬

Python 스크립트에 사용될 때는 톤 제어를 달성하려면 이슈#07의 압축 체계를 참조하십시오.

 spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )

params_infer_code = ChatTTS . Chat . InferCodeParams (
    spk_emb = spk_emb_str ,  # add sampled speaker
    temperature = .0003 ,  # using custom temperature
    top_P = 0.7 ,  # top P decode
    top_K = 20 ,  # top K decode
)

시작하기 튜토리얼

중국 튜토리얼

동영상	하이라이트
Tongji Zihao 형제	항목에서 고급까지 상세한 배포 자습서
ZTFS	Mac M1 배포 자습서
왕 - 바오 바오	Windows 배포 자습서

영어 튜토리얼

동영상	하이라이트
Sam Witteveen	영어 버전 소개

자주 묻는 질문

최근의 반복 후 소스 저장소 코드의 문제가 기본적으로 해결되었습니다. 문제가 발생하면 공식 설명 문서의 중국어 버전을 먼저 확인하는 것이 좋습니다.

모델을 다운로드 할 수 없습니다

원래 프로젝트는 Huggingface에서 해당 모델을 다운로드해야합니다. 대안으로 ModelScope에서 모델 및 구성을 다운로드하고 로컬 경로를 구성 할 수 있습니다.

중요한

Magic Tower의 모델 라이브러리는 자원 봉사자에 의해 유지되며 모든 모델이 최신 상태인지 확인하십시오.

터미널에 ModelScope 종속성을 설치하십시오

pip install modelscope

webui.py에서 코드를 수정하십시오

 # 在开头导入依赖，并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )

# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )

IDE에서 실행할 수 없습니다

IDE에서 실행될 때 파일의 상대 경로로 인해 스크립트가 원활하게 실행될 수 없습니다.

공식 문서의 빠른 시작시 지침을 참조하고 터미널에서 직접 실행하는 것이 좋습니다.

다음 명령을 실행할 때 프로젝트 루트 디렉토리에 있는지 확인하십시오.

1. Webui Visual 인터페이스

python examples/web/webui.py

2. 명령 줄 상호 작용

생성 된 오디오는 ./output_audio_n.mp3 로 저장됩니다

python examples/cmd/run.py " Your text 1. " " Your text 2. "

톤 태그 읽기

이 문제는 예를 들어 중국 구두점을 다룰 때 공식 코드가 항상 다루지 않기 때문에 발생합니까 ？ … 와 같은 기호는 처리되지 않아 모델 생성 중에 오류가 발생합니다.

유사한 중국 구두점 마크를 수동으로 삭제하거나 ChatTTS/utils/infer_utils.py 에서 코드를 수정하여 103 행의 character_map 사전에 누락 된 구두점 마크를 추가 할 수 있습니다.

 character_map = {
    '…' : '' ,
    '—' : ',' ,
    '＿' : ',' ,
    '？' : ',' ,
    }

GPU를 사용할 수 없습니다

GPU는 최소 4G 비디오 메모리가 필요합니다. 그렇지 않으면 CPU가 사용됩니다.

오류를 빠르게 점검하십시오

1. load_models() got an unexpected keyword argument 'source'

자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다

2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'

자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다

3. FileNotFoundError：［Erzno 2］ No such file or directory： 'C：\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots

자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다

4. local variable 'Normalizer' referenced before assignment

환경 구성을 완료 한 후 pynini 및 WeTextProcessing 종속성을 설치해야합니다.

conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing

5. download to Local path D：pythonlprojectChatTTSChatTTS failed.

IDE에서 직접 스크립트를 실행하면 파일 경로 문제로 인해 오류가보고됩니다. IDE에서 실행할 수 없습니다.

6. ModuleNotFoundError : No module named'Cython'

파이썬 실행 경로는 찾을 수 없으며 Windows 장치는 튜토리얼에 따라 환경 경로를 구성해야합니다.

프로젝트 트렌드

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-02-27
크기 7.95MB
출처 Github

Awesome ChatTTS

공식 소개

빠른 경험

인기있는 지점

기능적 향상

기능 확장

인터페이스 설명

텍스트 제어

톤 제어

정서적 통제

계수 제어

재생 제어

샘플 제어

톤 제어

webui

파이썬

시작하기 튜토리얼

중국 튜토리얼

영어 튜토리얼

자주 묻는 질문

모델을 다운로드 할 수 없습니다

IDE에서 실행할 수 없습니다

1. Webui Visual 인터페이스

2. 명령 줄 상호 작용

톤 태그 읽기

GPU를 사용할 수 없습니다

오류를 빠르게 점검하십시오

프로젝트 트렌드