Английский |
Awesome-Chattts-это официально рекомендуемый резюме Cattts Resource.
Если вы думаете, что этот проект полезен для вас, чтобы понять и использовать чаты, пожалуйста, дайте мне несколько наград и поддержку.
Примечание
Следующие проекты являются ресурсами сообщества.
Веб -сайт | тип |
---|---|
Оригинальная сеть | Оригинальный опыт веб -версии |
Кузница | Forge Enhanced Edition Experience |
Linux | Установочный пакет Python |
Образцы | Тон семян пример |
Клонирование | Тон -клонирование опыта |
проект | Звезда | Основные моменты |
---|---|---|
jianchang512/cattts-ui | Предоставляет интерфейс API, который можно вызвать в сторонних приложениях | |
6drf21e/Chattts_colab | Обеспечить потоковую передачу, поддержать длинное генерация звука и чтение частично-характерного характера | |
Lenml/Chattts-Forge | Обеспечивает улучшение вокала и снижение фонового шума с дополнительными быстрыми словами | |
CCMAHUA/CHATTTS Увеличено | Поддерживает партийную обработку файлов и экспорта файлов SRT | |
Hkoon/Cattts-Openvoice | Звуковой клонирование с OpenVoice |
проект | Звезда | Основные моменты |
---|---|---|
6drf21e/Chattts_speaker | Тональная маркировка персонажа и оценка стабильности | |
AIFSH/COMFYUI-Chattts | Версия Comfyui, которая может быть представлена как узел рабочего процесса | |
MaterialShadow/Chattts-Manager | Предоставляет систему управления тонами и интерфейс Webui |
После фактического тестирования существует значительная разница в эффекте генерации spk_emb
, когда генерируется указанное значение тона, и повторно использует предварительно сгенерированный spk_emb
.pt
Семена тона были первоначально отмечены и стабильной оценки в проекте Chattts_speaker, и правильный тон можно быстро выбрать с помощью примеров.
При использовании в официальном Webui вы можете напрямую скопировать тональный код и заменить значение в 9. Speaker Embedding
для достижения управления тоном.
При использовании в сценариях Python см.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)
видео | Основные моменты |
---|---|
Брат Тонгджи Зихао | Подробный учебник по развертыванию от входа в Advanced |
Ztfs | Учебное пособие по развертыванию MAC M1 |
Король - Бао Бао | Учебник по развертыванию Windows |
видео | Основные моменты |
---|---|
Сэм Виттейн | Введение в английскую версию |
После недавних итераций проблемы в коде хранилища источника были в основном решены. Если вы столкнетесь с проблемами, рекомендуется сначала проверить китайскую версию официального документа описания.
Оригинальный проект должен загрузить соответствующую модель из HuggingFace. В качестве альтернативы вы можете загрузить модель и конфигурацию из моделей и настроить локальный путь.
Важный
Библиотека модели на магической башне поддерживается волонтерами и не гарантирует, что все модели обновлены.
pip install modelscope
# 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )
При запуске в IDE сценарий не может работать плавно из -за относительного пути файла.
Рекомендуется ссылаться на инструкции в быстром запуске официальной документации и запустить ее непосредственно в терминале.
Убедитесь, что вы находитесь в каталоге Project Root при выполнении следующей команды.
python examples/web/webui.py
Сгенерированный звук будет сохранен на
./output_audio_n.mp3
python examples/cmd/run.py " Your text 1. " " Your text 2. "
Эта проблема возникает потому, что официальный код не охватывает, например, при работе с китайской пунктуацией ?
Символы, такие как …
не обрабатываются, что приводит к ошибке во время генерации модели.
Вы можете вручную удалить аналогичные китайские знаки препинания или изменить код в ChatTTS/utils/infer_utils.py
чтобы добавить недостающие знаки пунктуации в словарь character_map
в строках 103.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}
Главный процессор требует как минимум 4G видео памяти, в противном случае будет использоваться процессор.
1. load_models() got an unexpected keyword argument 'source'
Подробнее см. Часто задаваемые вопросы - модель не может быть загружена
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
Подробнее см. Часто задаваемые вопросы - модель не может быть загружена
3. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
Подробнее см. Часто задаваемые вопросы - модель не может быть загружена
4. local variable 'Normalizer' referenced before assignment
Вам необходимо установить зависимости pynini
и WeTextProcessing
после завершения конфигурации среды.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
Выполните сценарии непосредственно в IDE, и будет сообщена ошибка из -за проблем с путем файла .
6. ModuleNotFoundError : No module named'Cython'
Путь выполнения Python не найден, устройства Windows должны настроить путь среды в соответствии с учебником