Englisch | 简体中文 | Portugiesisch | 日本語 | 한국어
Diese Codebasis und alle Modelle werden unter der CC-BY-NC-SA-4.0-Lizenz veröffentlicht. Weitere Einzelheiten finden Sie unter LIZENZ.
Zero-Shot- und Few-Shot-TTS: Geben Sie ein 10 bis 30 Sekunden langes Stimm-Sample ein, um eine hochwertige TTS-Ausgabe zu erzeugen. Ausführliche Richtlinien finden Sie unter Best Practices für das Klonen von Stimmen.
Mehrsprachige und mehrsprachige Unterstützung: Kopieren Sie einfach mehrsprachigen Text und fügen Sie ihn in das Eingabefeld ein – Sie müssen sich keine Gedanken über die Sprache machen. Unterstützt derzeit Englisch, Japanisch, Koreanisch, Chinesisch, Französisch, Deutsch, Arabisch und Spanisch.
Keine Phonemabhängigkeit: Das Modell verfügt über starke Generalisierungsfähigkeiten und ist für TTS nicht auf Phoneme angewiesen. Es kann Text in jedem Sprachskript verarbeiten.
Äußerst genau: Erreicht eine niedrige CER (Character Error Rate) und WER (Word Error Rate) von etwa 2 % für 5-minütige englische Texte.
Schnell: Mit Fish-Tech-Beschleunigung beträgt der Echtzeitfaktor etwa 1:5 auf einem Nvidia RTX 4060-Laptop und 1:15 auf einem Nvidia RTX 4090.
WebUI-Inferenz: Bietet eine benutzerfreundliche, Gradio-basierte Web-Benutzeroberfläche, die mit Chrome, Firefox, Edge und anderen Browsern kompatibel ist.
GUI-Inferenz: Bietet eine grafische PyQt6-Schnittstelle, die nahtlos mit dem API-Server zusammenarbeitet. Unterstützt Linux, Windows und macOS. Siehe GUI.
Einfache Bereitstellung: Richten Sie ganz einfach einen Inferenzserver mit nativer Unterstützung für Linux, Windows und MacOS ein und minimieren Sie so Geschwindigkeitsverluste.
Wir übernehmen keine Verantwortung für eine illegale Nutzung der Codebasis. Bitte beachten Sie die örtlichen Gesetze zu DMCA und anderen damit verbundenen Gesetzen.
Fisch-Audio
inference.ipynb
Englisch
中文
日本語
Portugiesisch (Brasilien)
Englisch
中文
日本語
Portugiesisch (Brasilien)
VITS2 (daniilrobnikov)
Bert-VITS2
GPT VITS
MQTTS
GPT-Schnell
GPT-SoVITS
Datenverarbeitungssponsor von 6Block
Fish Audio wird auf Lepton.AI bereitgestellt