Englisch | vereinfacht Chinesisch
Awesome-Chattts ist ein offiziell empfohlenes Chattts-Ressourcenzusammenfassungsprojekt.
Wenn Sie der Meinung sind, dass dieses Projekt für Sie hilfreich ist, um Chattts zu verstehen und zu verwenden, geben Sie mir bitte einige Belohnungen und Unterstützung.
Notiz
Die folgenden Projekte sind Community -Ressourcen.
Webseite | Typ |
---|---|
Originales Web | Original -Web -Versionserfahrung |
Forge Web | Forge Enhanced Edition Experience |
Linux | Python -Installationspaket |
Proben | Tone Samen Beispiel |
Klonen | Töne Klonenerfahrung |
Projekt | Stern | Highlights |
---|---|---|
Jianchang512/Chattts-ui | Bietet eine API-Schnittstelle, die in Anwendungen von Drittanbietern aufgerufen werden kann | |
6DRF21E/chattts_colab | Bieten Sie Streaming-Ausgaben an, unterstützen Sie die lange Audiogenerierung und das Lesen von Teilcharakter | |
Lenml/Chattts-Forge | Bietet Vokalverbesserung und Hintergrundgeräuschreduzierung mit zusätzlichen schnellen Wörtern | |
Ccmahua/chattts-verstärkt | Unterstützt die Stapelverarbeitung von Dateien und Exporten von SRT -Dateien | |
Hkoon/Chattts-OpenVoice | Schallklonen mit OpenVoice |
Projekt | Stern | Highlights |
---|---|---|
6DRF21E/chattts_speaker | Ton -Charakter -Markierung und Stabilitätsbewertung | |
Aifsh/komfortable Chattts | Comfyui -Version, die als Workflow -Knoten eingeführt werden kann | |
MATERIALSHADOW/CHATTTS-MANAGER | Bietet ein Ton -Management -System und eine Webui -Schnittstelle |
Nach den tatsächlichen Tests gibt es einen signifikanten Unterschied in der Effekt der Erzeugung spk_emb
, wenn der angegebene Ton-Seed-Wert erzeugt wird und vorgenerierte spk_emb
wiederverwendet .pt
.
Die Tonsamen wurden zunächst markiert und im Projekt Chattts_speaker stabil und der richtige Ton kann schnell anhand von Beispielen ausgewählt werden.
Wenn Sie im offiziellen Webui verwendet werden, können Sie den Toncode direkt kopieren und den Wert in 9. Speaker Embedding
um die Tonsteuerung zu erreichen.
Wenn Sie in Python -Skripten verwendet werden, lesen Sie das Komprimierungsschema in Ausgabe Nr. 07, um die Tonsteuerung zu erreichen.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)
Video | Highlights |
---|---|
Bruder Tongji Zihao | Detailliertes Bereitstellungs -Tutorial von der Einreise bis zum Fortgeschrittenen |
Ztfs | MAC M1 -Bereitstellungs -Tutorial |
König - Bao Bao | Windows -Bereitstellungs -Tutorial |
Video | Highlights |
---|---|
Sam Witteen | Einführung in die englische Version |
Nach den jüngsten Iterationen wurden die Probleme im Quell -Repository -Code im Grunde genommen gelöst. Wenn Sie auf Probleme stoßen, wird empfohlen, zuerst die chinesische Version des offiziellen Beschreibungsdokuments zu überprüfen.
Das ursprüngliche Projekt muss das entsprechende Modell von Huggingface herunterladen. Alternativ können Sie das Modell und die Konfiguration von ModelsCope herunterladen und den lokalen Pfad konfigurieren.
Wichtig
Die Modellbibliothek auf dem Magic Tower wird von Freiwilligen gepflegt und garantiert nicht, dass alle Modelle auf dem neuesten Stand sind.
pip install modelscope
# 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )
Beim Ausführen in der IDE kann das Skript aufgrund des relativen Pfades der Datei nicht reibungslos ausgeführt werden.
Es wird empfohlen, sich auf die Anweisungen im schnellen Start der offiziellen Dokumentation zu verweisen und direkt im Terminal auszuführen.
Stellen Sie sicher, dass Sie sich im Projekt Root -Verzeichnis befinden, wenn Sie den folgenden Befehl ausführen.
python examples/web/webui.py
Das generierte Audio wird auf
./output_audio_n.mp3
gespeichert
python examples/cmd/run.py " Your text 1. " " Your text 2. "
Dieses Problem tritt auf, weil der offizielle Code beispielsweise nicht die ganze Zeit über die chinesische Interpunktion abdeckt ?
Symbole wie, …
werden nicht verarbeitet, was zu einem Fehler während der Modellgenerierung führt.
Sie können ähnliche chinesische Interpunktionsmarken manuell löschen oder den Code in ChatTTS/utils/infer_utils.py
ändern, um dem Wörterbuch von character_map
in den Zeilen 103 fehlende Zeichenzeichen hinzuzufügen.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}
Die GPU benötigt mindestens 4G Videospeicher, ansonsten wird die CPU für verwandte Probleme verwendet. Weitere Informationen finden Sie in den Anweisungen im Chattts-UI-Projekt.
1. load_models() got an unexpected keyword argument 'source'
Einzelheiten finden Sie in FAQs - Modell kann nicht heruntergeladen werden
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
Einzelheiten finden Sie in FAQs - Modell kann nicht heruntergeladen werden
3.. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
Einzelheiten finden Sie in FAQs - Modell kann nicht heruntergeladen werden
4. local variable 'Normalizer' referenced before assignment
Sie müssen nach Abschluss der Umgebungskonfiguration pynini
und WeTextProcessing
-Abhängigkeiten installieren.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
Führen Sie Skripte direkt in der IDE aus , und ein Fehler wird aufgrund von Dateipfadproblemen gemeldet.
6. ModuleNotFoundError : No module named'Cython'
Der Python -Ausführungspfad wird nicht gefunden. Windows -Geräte müssen den Umgebungsweg gemäß dem Tutorial konfigurieren