Anglais | 简体中文 | Portugais | 日本語 | 한국어
Cette base de code et tous les modèles sont publiés sous licence CC-BY-NC-SA-4.0. Veuillez vous référer à LICENCE pour plus de détails.
Zero-shot et Few-shot TTS : saisissez un échantillon vocal de 10 à 30 secondes pour générer une sortie TTS de haute qualité. Pour obtenir des instructions détaillées, consultez Meilleures pratiques en matière de clonage vocal.
Prise en charge multilingue et multilingue : copiez et collez simplement le texte multilingue dans la zone de saisie : pas besoin de vous soucier de la langue. Prend actuellement en charge l'anglais, le japonais, le coréen, le chinois, le français, l'allemand, l'arabe et l'espagnol.
Aucune dépendance aux phonèmes : le modèle possède de fortes capacités de généralisation et ne s'appuie pas sur des phonèmes pour le TTS. Il peut gérer du texte dans n’importe quelle langue.
Hautement précis : atteint un faible CER (taux d'erreur sur les caractères) et WER (taux d'erreur sur les mots) d'environ 2 % pour les textes en anglais de 5 minutes.
Rapide : avec l'accélération fish-tech, le facteur temps réel est d'environ 1:5 sur un ordinateur portable Nvidia RTX 4060 et 1:15 sur un Nvidia RTX 4090.
Inférence WebUI : propose une interface utilisateur Web facile à utiliser, basée sur Gradio, compatible avec Chrome, Firefox, Edge et d'autres navigateurs.
Inférence GUI : offre une interface graphique PyQt6 qui fonctionne de manière transparente avec le serveur API. Prend en charge Linux, Windows et macOS. Voir interface graphique.
Déploiement convivial : configurez facilement un serveur d'inférence avec une prise en charge native de Linux, Windows et MacOS, minimisant ainsi la perte de vitesse.
Nous déclinons toute responsabilité en cas d'utilisation illégale de la base de code. Veuillez vous référer aux lois locales concernant le DMCA et aux autres lois connexes.
Audio de poisson
inférence.ipynb
Anglais
Chine
日本語
Portugais (Brésil)
Anglais
Chine
日本語
Portugais (Brésil)
VITS2 (Daniilrobnikov)
Bert-VITS2
VITS GPT
MQTTS
GPT rapide
GPT-SoVITS
Sponsor du traitement des données par 6Block
Fish Audio est diffusé sur Lepton.AI