Awesome ChatTTS скачать - Загрузить исходный код Awesome ChatTTS

Awesome ChatTTS

Другой исходный код

1.0.0

Скачать

Английский |

Awesome-Chattts-это официально рекомендуемый резюме Cattts Resource.

Если вы думаете, что этот проект полезен для вас, чтобы понять и использовать чаты, пожалуйста, дайте мне несколько наград и поддержку.

Примечание

Следующие проекты являются ресурсами сообщества.

Официальное введение
Быстрый опыт
Популярные филиалы
Описание интерфейса
Контроль тона
Начало работы
Часто задаваемые вопросы
Быстрая проверка ошибок

Официальное введение

Чаты .-. 001 .-. Chattts.mp4

Быстрый опыт

Веб -сайт	тип
Оригинальная сеть	Оригинальный опыт веб -версии
Кузница	Forge Enhanced Edition Experience
Linux	Установочный пакет Python
Образцы	Тон семян пример
Клонирование	Тон -клонирование опыта

проект	Звезда	Основные моменты
jianchang512/cattts-ui		Предоставляет интерфейс API, который можно вызвать в сторонних приложениях
6drf21e/Chattts_colab		Обеспечить потоковую передачу, поддержать длинное генерация звука и чтение частично-характерного характера
Lenml/Chattts-Forge		Обеспечивает улучшение вокала и снижение фонового шума с дополнительными быстрыми словами
CCMAHUA/CHATTTS Увеличено		Поддерживает партийную обработку файлов и экспорта файлов SRT
Hkoon/Cattts-Openvoice		Звуковой клонирование с OpenVoice

проект	Звезда	Основные моменты
6drf21e/Chattts_speaker		Тональная маркировка персонажа и оценка стабильности
AIFSH/COMFYUI-Chattts		Версия Comfyui, которая может быть представлена как узел рабочего процесса
MaterialShadow/Chattts-Manager		Предоставляет систему управления тонами и интерфейс Webui

Описание интерфейса

Описание элемента конфигурации

Текстовый элемент управления

1. Входной текст : текст, который необходимо преобразовать, поддерживает смешанный китайский и английский язык
2. Уточнить текст : использовать ли разговорная обработка текста
3. Семя текста : настраивайте значения семян текста, разные семена соответствуют разным разговорным стилям
4.: случайным образом генерировать значения семян текста
5. Вывод текста : текст, сгенерированный после разговора

Контроль тона

6. Timbre : предварительно установленное значение семянного тона
7. Audio Seed : Настройте значение семян тона, разные семена соответствуют разным тонам
8.
9. Справочник: встроенный : тональный код, для деталей см. Управление тона

Эмоциональный контроль

10. Температура : контролирует аудио эмоциональную волатильность, с диапазоном 0-1.
11. Top_P : контролирует эмоциональную корреляцию звука, с диапазоном 0,1-0,9.
12. Top_K : контролирует эмоциональное сходство звука, с диапазоном 1-20.

Коэффициент управления

13. Коэффициент DVAE : код коэффициента модели
14. перезагрузить : перезагрузить коэффициенты модели

Воспроизведение контроль

15. Auto Play : автоматически воспроизводить звук после его создания
16. Режим потока : включить вывод потоковой передачи
17. Сгенерировать : нажмите, чтобы сгенерировать аудиофайл
18. Выходной аудио : результаты генерации звука
19. ↓ : нажмите, чтобы загрузить аудиофайл
20 ▶ ️ : Нажмите, чтобы воспроизвести аудиофайл

Образец контроль

21. Пример : нажмите, чтобы переключить пример конфигурации

Контроль тона

После фактического тестирования существует значительная разница в эффекте генерации spk_emb , когда генерируется указанное значение тона, и повторно использует предварительно сгенерированный spk_emb .pt

Семена тона были первоначально отмечены и стабильной оценки в проекте Chattts_speaker, и правильный тон можно быстро выбрать с помощью примеров.

Webui

При использовании в официальном Webui вы можете напрямую скопировать тональный код и заменить значение в 9. Speaker Embedding для достижения управления тоном.

Питон

При использовании в сценариях Python см.

 spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )

params_infer_code = ChatTTS . Chat . InferCodeParams (
    spk_emb = spk_emb_str ,  # add sampled speaker
    temperature = .0003 ,  # using custom temperature
    top_P = 0.7 ,  # top P decode
    top_K = 20 ,  # top K decode
)

Начало работы

Китайский учебник

видео	Основные моменты
Брат Тонгджи Зихао	Подробный учебник по развертыванию от входа в Advanced
Ztfs	Учебное пособие по развертыванию MAC M1
Король - Бао Бао	Учебник по развертыванию Windows

Английский учебник

видео	Основные моменты
Сэм Виттейн	Введение в английскую версию

Часто задаваемые вопросы

После недавних итераций проблемы в коде хранилища источника были в основном решены. Если вы столкнетесь с проблемами, рекомендуется сначала проверить китайскую версию официального документа описания.

Модель не может быть загружена

Оригинальный проект должен загрузить соответствующую модель из HuggingFace. В качестве альтернативы вы можете загрузить модель и конфигурацию из моделей и настроить локальный путь.

Важный

Библиотека модели на магической башне поддерживается волонтерами и не гарантирует, что все модели обновлены.

Установить зависимости моделей в терминале

pip install modelscope

Изменить код в webui.py

 # 在开头导入依赖，并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )

# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )

Не могу бежать в IDE

При запуске в IDE сценарий не может работать плавно из -за относительного пути файла.

Рекомендуется ссылаться на инструкции в быстром запуске официальной документации и запустить ее непосредственно в терминале.

Убедитесь, что вы находитесь в каталоге Project Root при выполнении следующей команды.

1. Визуальный интерфейс Webui

python examples/web/webui.py

2. Взаимодействие командной строки

Сгенерированный звук будет сохранен на ./output_audio_n.mp3

python examples/cmd/run.py " Your text 1. " " Your text 2. "

Tone Tag Read

Эта проблема возникает потому, что официальный код не охватывает, например, при работе с китайской пунктуацией ？ Символы, такие как … не обрабатываются, что приводит к ошибке во время генерации модели.

Вы можете вручную удалить аналогичные китайские знаки препинания или изменить код в ChatTTS/utils/infer_utils.py чтобы добавить недостающие знаки пунктуации в словарь character_map в строках 103.

 character_map = {
    '…' : '' ,
    '—' : ',' ,
    '＿' : ',' ,
    '？' : ',' ,
    }

Графический процессор недоступен

Главный процессор требует как минимум 4G видео памяти, в противном случае будет использоваться процессор.

Быстрая проверка ошибок

1. load_models() got an unexpected keyword argument 'source'

Подробнее см. Часто задаваемые вопросы - модель не может быть загружена

2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'

Подробнее см. Часто задаваемые вопросы - модель не может быть загружена

3. FileNotFoundError：［Erzno 2］ No such file or directory： 'C：\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots

Подробнее см. Часто задаваемые вопросы - модель не может быть загружена

4. local variable 'Normalizer' referenced before assignment

Вам необходимо установить зависимости pynini и WeTextProcessing после завершения конфигурации среды.

conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing

5. download to Local path D：pythonlprojectChatTTSChatTTS failed.

Выполните сценарии непосредственно в IDE, и будет сообщена ошибка из -за проблем с путем файла .

6. ModuleNotFoundError : No module named'Cython'

Путь выполнения Python не найден, устройства Windows должны настроить путь среды в соответствии с учебником

Проектные тенденции

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-27
размер 7.95MB
От Github

Связанные приложения

awesome citygml

2024-11-13
awesome generative ai guide

2024-11-05
GitHub sgrebnov/cordova plugin background download

2024-11-05
awesome swift

2024-11-03
Потрясающая игра про дьявола

2023-04-16
Потрясающая реклама

2022-08-08

Awesome ChatTTS

Официальное введение

Быстрый опыт

Популярные филиалы

Функциональное улучшение

Функциональное расширение

Описание интерфейса

Текстовый элемент управления

Контроль тона

Эмоциональный контроль

Коэффициент управления

Воспроизведение контроль

Образец контроль

Контроль тона

Webui

Питон

Начало работы

Китайский учебник

Английский учебник

Часто задаваемые вопросы

Модель не может быть загружена

Не могу бежать в IDE

1. Визуальный интерфейс Webui

2. Взаимодействие командной строки

Tone Tag Read

Графический процессор недоступен

Быстрая проверка ошибок

Проектные тенденции