Um nó confortável personalizado para o módulo XTTS da Coqui-AI/TTS!
Inglês (en), espanhol (s), francês (FR), alemão (de), italiano (IT), português (pt), polonês (PL), turco (tr), russo (ru), holandês (nl), Tcheca (CS), árabe (AR), chinês (ZH-CN), japonês (JA), húngaro (HU), coreano (ko) hindi (HI)
Não se responsabiliza por qualquer uso ilegal da base de código.
srt
para a legenda foi suportadosrt
Verifique se ffmpeg
está trabalhado em sua linha de comando para Linux
apt update
apt install ffmpeg
Para Windows, você pode instalar ffmpeg
por WineTui automaticamente
Então!
git clone https://github.com/AIFSH/ComfyUI-XTTS.git
cd ComfyUI-XTTS
pip install -r requirements.txt
weights
serão baixados do HuggingFace automaticamente!
Ou faça o download do arquivo de peso e descompacte-o, coloque a pasta inteira de pretrained_models
no diretório ComfyUI-XTTS
Demonstração
temperature
: a temperatura softmax do modelo autoregressivo.
length_penalty
: uma penalidade de comprimento aplicada ao decodificador autoregressivo.
repetition_penalty
: uma penalidade que impede o decodificador autoregressivo de se repetir durante a decodificação.
top_k
: Valores mais baixos significam que o decodificador produz mais "prováveis" (também conhecidos como choras).
top_p
: Valores mais baixos significam que o decodificador produz mais "prováveis" (também conhecidos como choras).
speed
: a taxa de velocidade do áudio gerado.
coqui-ai/tts