英語| 简体中文 |ポルトガル語 | 日本語 | 한국어
このコードベースとすべてのモデルは CC-BY-NC-SA-4.0 ライセンスに基づいてリリースされています。詳細については、ライセンスを参照してください。
ゼロショット & フューショット TTS: 10 ~ 30 秒のボーカル サンプルを入力して、高品質の TTS 出力を生成します。詳細なガイドラインについては、「音声クローン作成のベスト プラクティス」を参照してください。
多言語およびクロスリンガルのサポート:多言語テキストをコピーして入力ボックスに貼り付けるだけで、言語を気にする必要はありません。現在、英語、日本語、韓国語、中国語、フランス語、ドイツ語、アラビア語、スペイン語をサポートしています。
音素の依存性なし:このモデルには強力な一般化機能があり、TTS の音素に依存しません。あらゆる言語スクリプトのテキストを処理できます。
高精度: 5 分間の英語テキストで約 2% という低い CER (文字誤り率) と WER (単語誤り率) を実現します。
高速: Fish-Tech アクセラレーションを使用すると、リアルタイム係数は Nvidia RTX 4060 ラップトップで約 1:5、Nvidia RTX 4090 で 1:15 になります。
WebUI 推論: Chrome、Firefox、Edge、およびその他のブラウザーと互換性のある、使いやすい Gradio ベースの Web UI を備えています。
GUI 推論: API サーバーとシームレスに動作する PyQt6 グラフィカル インターフェイスを提供します。 Linux、Windows、macOS をサポートします。 GUIを参照してください。
導入に優しい: Linux、Windows、MacOS をネイティブでサポートする推論サーバーを簡単にセットアップし、速度の低下を最小限に抑えます。
コードベースの違法な使用については、当社は一切の責任を負いません。 DMCA およびその他の関連法については、現地の法律を参照してください。
魚オーディオ
推論.ipynb
英語
中国語
日本語
ポルトガル語 (ブラジル)
英語
中国語
日本語
ポルトガル語 (ブラジル)
VITS2 (ダニイルロブニコフ)
バート-VITS2
GPT VITS
MQTTS
GPT高速
GPT-SoVITS
データ処理スポンサー:6Block
Fish Audio は Lepton.AI で提供されます