Inglês |
Awesome-Chattts é um projeto de resumo de recursos de chattts oficialmente recomendado.
Se você acha que este projeto é útil para você entender e usar chattts, dê -me algumas recompensas e apoio.
Observação
Os seguintes projetos são recursos da comunidade.
Site | tipo |
---|---|
Web original | Experiência original da versão da web |
Forge web | Forge Forge Enhanced Edition Experience |
Linux | Pacote de instalação do Python |
Amostras | Exemplo de semente de tom |
Clonagem | Experiência de clonagem de tom |
projeto | Estrela | Destaques |
---|---|---|
jianchang512/chattts-ui | Fornece interface API que pode ser chamada em aplicativos de terceiros | |
6DRF21E/CHATTTS_COLAB | Forneça saída de streaming, suporte a geração de áudio longa e leitura de caracteres parcial | |
Lenml/Chattts-Forge | Fornece aprimoramento vocal e redução de ruído de fundo, com palavras rápidas adicionais disponíveis | |
CCMAHua/Chattts-aprimorou | Suporta o processamento em lote de arquivos e exportações de arquivos SRT | |
HKOON/CHATTTS-OpenVoice | Clonagem de som com openvoice |
projeto | Estrela | Destaques |
---|---|---|
6drf21e/chattts_speaker | Tone Caractere marcação e avaliação de estabilidade | |
AIFSH/COMFYUI-CHATTTS | Versão confortyui, que pode ser introduzida como um nó de fluxo de trabalho | |
Materialshadow/Chattts-manager | Fornece um sistema de gerenciamento de tons e interface webui |
Após o .pt
real, há uma diferença significativa no efeito de gerar spk_emb
cada vez que o valor de semente de tom especificado é gerado e reutilizando spk_emb
pré-gerado.
As sementes de tom foram inicialmente marcadas e a avaliação estável no projeto Chattts_Speaker, e o tom certo pode ser selecionado rapidamente por meio de exemplos.
Quando usado no webui oficial, você pode copiar diretamente o código de tom e substituir o valor em 9. Speaker Embedding
para obter controle de tom.
Quando usado em scripts Python, consulte o esquema de compactação na edição nº 07 para obter o controle de tom.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)
vídeo | Destaques |
---|---|
Irmão Tongji Zihao | Tutorial detalhado de implantação da entrada para avançado |
Ztfs | Tutorial de implantação Mac M1 |
King - Bao Bao | Tutorial de implantação do Windows |
vídeo | Destaques |
---|---|
Sam Witteveen | Introdução à versão em inglês |
Após iterações recentes, os problemas no código do repositório de origem foram basicamente resolvidos. Se você encontrar problemas, é recomendável verificar a versão chinesa do documento de descrição oficial em detalhes primeiro.
O projeto original precisa fazer o download do modelo correspondente do HuggingFace. Como alternativa, você pode baixar o modelo e a configuração do ModelCope e configurar o caminho local.
Importante
A biblioteca de modelos na torre mágica é mantida por voluntários e não garante que todos os modelos estejam atualizados.
pip install modelscope
# 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )
Ao executar no IDE, o script não pode ser executado sem problemas devido ao caminho relativo do arquivo.
Recomenda -se consultar as instruções na inicialização rápida da documentação oficial e executá -la diretamente no terminal.
Verifique se você está no diretório raiz do projeto ao executar o seguinte comando.
python examples/web/webui.py
O áudio gerado será salvo para
./output_audio_n.mp3
python examples/cmd/run.py " Your text 1. " " Your text 2. "
Esse problema ocorre porque o código oficial não cobre o tempo todo ao lidar com a pontuação chinesa, por exemplo ?
Símbolos como, …
não são processados, resultando em um erro durante a geração do modelo.
Você pode excluir manualmente marcas de pontuação chinesa semelhantes ou modificar o código em ChatTTS/utils/infer_utils.py
para adicionar pontos de pontuação ausentes ao dicionário de character_map
nas linhas 103.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}
A GPU requer pelo menos a memória de vídeo 4G, caso contrário, a CPU será usada.
1. load_models() got an unexpected keyword argument 'source'
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
3. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
4. local variable 'Normalizer' referenced before assignment
Você precisa instalar dependências pynini
e WeTextProcessing
após concluir a configuração do ambiente.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
Execute os scripts diretamente no IDE e um erro será relatado devido a problemas do caminho do arquivo.
6. ModuleNotFoundError : No module named'Cython'
O caminho de execução do Python não é encontrado, os dispositivos Windows precisam configurar o caminho do ambiente de acordo com o tutorial