Descarga Awesome ChatTTS - Descargar el código fuente Awesome ChatTTS

Awesome ChatTTS

Otro código fuente

1.0.0

Descargar

Inglés |

Awesome-Chattts es un proyecto de resumen de recursos de Chattts oficialmente recomendado.

Si cree que este proyecto es útil para que comprenda y use Chattts, por favor, déme algunas recompensas y soporte.

Nota

Los siguientes proyectos son recursos comunitarios.

Introducción oficial
Experiencia rápida
Ramas populares
Descripción de la interfaz
Control de tono
Tutorial de inicio
Preguntas frecuentes
Verificación rápida de errores

Introducción oficial

Chattts .-. 001 .-. Chattts.mp4

Experiencia rápida

Sitio web	tipo
Web original	Experiencia de versión web original
Forge Web	Experiencia de edición mejorada de Forge
Linux	Paquete de instalación de Python
Muestras	Ejemplo de semillas de tono
Clonación	Experiencia de clonación de tono

Ramas populares

Mejora funcional

proyecto	Estrella	Reflejos
jianchang512/chattts-ui		Proporciona interfaz API que se puede llamar en aplicaciones de terceros
6drf21e/chattts_colab		Proporcionar salida de transmisión, soporte de generación de audio larga y lectura de características parciales
Lenml/Chattts-Forge		Proporciona mejora vocal y reducción de ruido de fondo, con palabras rápidas adicionales disponibles
Ccmahua/chattts mejorado		Admite el procesamiento por lotes de archivos y exportaciones de archivos SRT
HKOON/CHATTTS-OPENVOICE		Clonación de sonido con OpenVoice

Extensión funcional

proyecto	Estrella	Reflejos
6drf21e/chattts_speaker		Marcado del personaje de tono y evaluación de estabilidad
Aifsh/comfyui-chattts		Comfyui versión, que se puede introducir como un nodo de flujo de trabajo
MaterialShadow/Chattts-Manager		Proporciona un sistema de administración de tono y una interfaz WebUI

Descripción de la interfaz

Descripción del elemento de configuración

Control de texto

1. Texto de entrada : texto que debe convertirse, admite chino mixto e inglés
2. Refinar texto : si se debe usar el procesamiento coloquial del texto
3. Semilla de texto : Configurar valores de semillas de texto, diferentes semillas corresponden a diferentes estilos coloquiales
4.?
5. Texto de salida : texto generado después del procesamiento coloquial

Control de tono

6. Timbre : valor de semilla de tono preestablecido
7. Semilla de audio : configure el valor de semilla de tono, las diferentes semillas corresponden a diferentes tonos
8.?
9. Incrustación de altavoces : código de tono, consulte el control de tono para más detalles

Control emocional

10. Temperatura : controla la volatilidad emocional de audio, con un rango de 0-1.
11. TOP_P : controla la correlación emocional del audio, con un rango de 0.1-0.9.
12. Top_k : controla la similitud emocional del audio, con un rango de 1-20.

Control de coeficiente

13. Coeficiente de DVAE : código de coeficiente de modelo
14. Recargar : recargar coeficientes del modelo

Control de reproducción

15. Reproducción automática : si reproducir automáticamente audio después de que se genere
16. Modo de transmisión : si habilita la salida de transmisión
17. Generar : haga clic para generar archivo de audio
18. Audio de salida : resultados de la generación de audio
19. ↓ : haga clic para descargar el archivo de audio
20. ▶ ️ : Haga clic para reproducir el archivo de audio

Control de muestra

21. Ejemplo : haga clic para cambiar la configuración de ejemplo

Control de tono

Después de las .pt reales, hay una diferencia significativa en el efecto de generar spk_emb cada vez que se genera el valor de semilla de tono especificado y reutilizando spk_emb pregenerado.

Las semillas de tono fueron inicialmente marcadas y una evaluación estable en el proyecto Chattts_Speaker, y el tono correcto se puede seleccionar rápidamente a través de ejemplos.

audio-código.png

Webui

Cuando se usa en el WebUI oficial, puede copiar directamente el código de tono y reemplazar el valor en 9. Speaker Embedding para lograr el control de tono.

Pitón

Cuando se use en los scripts de Python, consulte el esquema de compresión en el número 07 para lograr el control de tono.

 spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )

params_infer_code = ChatTTS . Chat . InferCodeParams (
    spk_emb = spk_emb_str ,  # add sampled speaker
    temperature = .0003 ,  # using custom temperature
    top_P = 0.7 ,  # top P decode
    top_K = 20 ,  # top K decode
)

Tutorial de inicio

Tutorial chino

video	Reflejos
Hermano Tongji Zihao	Tutorial de implementación detallado desde la entrada a avanzado
ZTFS	Tutorial de implementación de Mac M1
Rey - Bao Bao	Tutorial de implementación de Windows

Tutorial de inglés

video	Reflejos
Sam Witteveen	Introducción a la versión en inglés

Preguntas frecuentes

Después de las iteraciones recientes, los problemas en el código de repositorio de fuente se han resuelto básicamente. Si encuentra problemas, se recomienda verificar primero la versión china del documento de descripción oficial en detalle.

El modelo no se puede descargar

El proyecto original necesita descargar el modelo correspondiente de Huggingface. Como alternativa, puede descargar el modelo y la configuración de Modelscope y configurar la ruta local.

Importante

La biblioteca de modelos en la Torre Mágica es mantenida por voluntarios y no garantiza que todos los modelos estén actualizados.

Instale las dependencias de Modelscope en la terminal

pip install modelscope

Modificar el código en webui.py

 # 在开头导入依赖，并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )

# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )

No se puede correr en IDE

Cuando se ejecuta en el IDE, el script no puede ejecutarse sin problemas debido a la ruta relativa del archivo.

Se recomienda consultar las instrucciones en el inicio rápido de la documentación oficial y ejecutarla directamente en la terminal.

Asegúrese de estar en el Directorio Root del Proyecto al ejecutar el siguiente comando.

1. interfaz visual webui

python examples/web/webui.py

2. Interacción de línea de comandos

El audio generado se guardará en ./output_audio_n.mp3

python examples/cmd/run.py " Your text 1. " " Your text 2. "

Etiqueta de tono leído

¿Este problema ocurre porque el código oficial no cubre todo el tiempo cuando se trata de puntuación china, por ejemplo ？ Los símbolos como, … no se procesan, lo que resulta en un error durante la generación de modelos.

Puede eliminar manualmente signos de puntuación chinos similares, o modificar el código en ChatTTS/utils/infer_utils.py para agregar puntos de puntuación faltantes al diccionario de character_map en las líneas 103.

 character_map = {
    '…' : '' ,
    '—' : ',' ,
    '＿' : ',' ,
    '？' : ',' ,
    }

GPU no disponible

La GPU requiere al menos la memoria de video 4G, de lo contrario, se utilizará la CPU.

Verificación rápida de errores

1. load_models() got an unexpected keyword argument 'source'

Ver preguntas frecuentes para más detalles: el modelo no se puede descargar

2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'

Ver preguntas frecuentes para más detalles: el modelo no se puede descargar

3 FileNotFoundError：［Erzno 2］ No such file or directory： 'C：\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots

Ver preguntas frecuentes para más detalles: el modelo no se puede descargar

4. local variable 'Normalizer' referenced before assignment

Debe instalar las dependencias de pynini y WeTextProcessing después de completar la configuración del entorno.

conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing

5. download to Local path D：pythonlprojectChatTTSChatTTS failed.

Ejecutar scripts directamente en el IDE, y se informará un error debido a problemas de ruta de archivo.

6. ModuleNotFoundError : No module named'Cython'

No se encuentra la ruta de ejecución de Python, los dispositivos de Windows deben configurar la ruta de entorno de acuerdo con el tutorial

Tendencias del proyecto

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-02-27
tamaño 7.95MB
Proviene de Github

Aplicaciones relacionadas

awesome citygml

2024-11-13
awesome generative ai guide

2024-11-05
GitHub sgrebnov/cordova plugin background download

2024-11-05
awesome swift

2024-11-03
Impresionante juego del diablo

2023-04-16
El anuncio impresionante

2022-08-08

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
Sunamu

Otro código fuente

Release 2.2.0
MySchedule.py

Otro código fuente

Updates to the fetching of week codes
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo