영어 |. 단순화
Awesome Chattts는 공식적으로 권장되는 Chattts Resource Summary 프로젝트입니다.
이 프로젝트가 Chattts를 이해하고 사용하는 데 도움이된다고 생각되면 보상과 지원을 해주세요.
메모
다음 프로젝트는 커뮤니티 리소스입니다.
웹 사이트 | 유형 |
---|---|
오리지널 웹 | 오리지널 웹 버전 경험 |
위조 웹 | 강화 된 에디션 경험을 위조하십시오 |
리눅스 | 파이썬 설치 패키지 |
샘플 | 톤 씨앗 예제 |
복제 | 톤 클로닝 경험 |
프로젝트 | 별 | 하이라이트 |
---|---|---|
Jianchang512/Chattts-UI | 타사 응용 프로그램에서 호출 할 수있는 API 인터페이스를 제공합니다. | |
6DRF21E/chattts_colab | 스트리밍 출력 제공, 긴 오디오 생성 및 부품 문자 읽기를 지원합니다. | |
lenml/chattts-forge | 추가 신속한 단어를 사용하여 보컬 향상 및 배경 노이즈 감소를 제공합니다. | |
ccmahua/chattts-enhanced | 파일의 배치 처리 및 SRT 파일의 내보내기 지원 | |
Hkoon/Chattts-Openvoice | OpenVoice로 사운드 클로닝 |
프로젝트 | 별 | 하이라이트 |
---|---|---|
6DRF21E/chattts_speaker | 톤 문자 표시 및 안정성 평가 | |
aifsh/comfyui-chattts | 워크 플로 노드로 소개 될 수있는 comfyui 버전 | |
Materialshadow/Chattts-Manager | 톤 관리 시스템 및 WebUI 인터페이스를 제공합니다 |
실제 테스트 후, 지정된 톤 시드 값이 생성 될 때마다 spk_emb
생성하고 사전 생성 된 spk_emb
.pt
하는 데 큰 차이가 있습니다.
톤 씨앗은 초기에 Chatts_speaker 프로젝트에서 표시되고 안정적인 평가되었으며 예제를 통해 올바른 톤을 빠르게 선택할 수 있습니다.
공식 WebUI에서 사용될 때는 톤 코드를 직접 복사하고 9의 값을 9. Speaker Embedding
바꾸어 톤 제어를 달성 할 수 있습니다.
Python 스크립트에 사용될 때는 톤 제어를 달성하려면 이슈#07의 압축 체계를 참조하십시오.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)
동영상 | 하이라이트 |
---|---|
Tongji Zihao 형제 | 항목에서 고급까지 상세한 배포 자습서 |
ZTFS | Mac M1 배포 자습서 |
왕 - 바오 바오 | Windows 배포 자습서 |
동영상 | 하이라이트 |
---|---|
Sam Witteveen | 영어 버전 소개 |
최근의 반복 후 소스 저장소 코드의 문제가 기본적으로 해결되었습니다. 문제가 발생하면 공식 설명 문서의 중국어 버전을 먼저 확인하는 것이 좋습니다.
원래 프로젝트는 Huggingface에서 해당 모델을 다운로드해야합니다. 대안으로 ModelScope에서 모델 및 구성을 다운로드하고 로컬 경로를 구성 할 수 있습니다.
중요한
Magic Tower의 모델 라이브러리는 자원 봉사자에 의해 유지되며 모든 모델이 최신 상태인지 확인하십시오.
pip install modelscope
# 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )
IDE에서 실행될 때 파일의 상대 경로로 인해 스크립트가 원활하게 실행될 수 없습니다.
공식 문서의 빠른 시작시 지침을 참조하고 터미널에서 직접 실행하는 것이 좋습니다.
다음 명령을 실행할 때 프로젝트 루트 디렉토리에 있는지 확인하십시오.
python examples/web/webui.py
생성 된 오디오는
./output_audio_n.mp3
로 저장됩니다
python examples/cmd/run.py " Your text 1. " " Your text 2. "
이 문제는 예를 들어 중국 구두점을 다룰 때 공식 코드가 항상 다루지 않기 때문에 발생합니까 ?
…
와 같은 기호는 처리되지 않아 모델 생성 중에 오류가 발생합니다.
유사한 중국 구두점 마크를 수동으로 삭제하거나 ChatTTS/utils/infer_utils.py
에서 코드를 수정하여 103 행의 character_map
사전에 누락 된 구두점 마크를 추가 할 수 있습니다.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}
GPU는 최소 4G 비디오 메모리가 필요합니다. 그렇지 않으면 CPU가 사용됩니다.
1. load_models() got an unexpected keyword argument 'source'
자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다
3. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
자세한 내용은 FAQ를 참조하십시오 - 모델을 다운로드 할 수 없습니다
4. local variable 'Normalizer' referenced before assignment
환경 구성을 완료 한 후 pynini
및 WeTextProcessing
종속성을 설치해야합니다.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
IDE에서 직접 스크립트를 실행하면 파일 경로 문제로 인해 오류가보고됩니다. IDE에서 실행할 수 없습니다.
6. ModuleNotFoundError : No module named'Cython'
파이썬 실행 경로는 찾을 수 없으며 Windows 장치는 튜토리얼에 따라 환경 경로를 구성해야합니다.