英語| 簡體中文 |葡萄牙語 | 日本語 | 한국어
此程式碼庫和所有模型均根據 CC-BY-NC-SA-4.0 授權發布。請參閱許可證以了解更多詳細資訊。
零樣本和少樣本 TTS:輸入 10 到 30 秒的聲音樣本以產生高品質的 TTS 輸出。有關詳細指南,請參閱語音克隆最佳實踐。
多語言和跨語言支援:只需將多語言文字複製並貼上到輸入框中即可,無需擔心語言問題。目前支援英語、日語、韓語、中文、法語、德語、阿拉伯語和西班牙語。
無音素依賴:模型泛化能力強,不依賴音素進行TTS。它可以處理任何語言腳本中的文字。
高度準確: 5 分鐘英文文字的 CER(字元錯誤率)和 WER(單字錯誤率)較低,約 2%。
快速:透過 Fish-Tech 加速,Nvidia RTX 4060 筆記型電腦上的即時係數約為 1:5,Nvidia RTX 4090 上的即時係數約為 1:15。
WebUI 推理:具有易於使用、基於 Gradio 的 Web UI,與 Chrome、Firefox、Edge 和其他瀏覽器相容。
GUI 推理:提供與 API 伺服器無縫協作的 PyQt6 圖形介面。支援 Linux、Windows 和 macOS。參見圖形使用者介面。
部署友善:輕鬆設定推理伺服器,提供 Linux、Windows 和 MacOS 的本機支持,最大限度地減少速度損失。
對於任何非法使用程式碼庫的行為,我們不承擔任何責任。請參閱您當地有關 DMCA 的法律和其他相關法律。
魚音訊
推理.ipynb
英語
中文
日本語
葡萄牙語(巴西)
英語
中文
日本語
葡萄牙語(巴西)
VITS2(丹尼爾·羅布尼科夫)
伯特-VITS2
GPT 維特斯
MQTTS
GPT 快速
GPT-蘇聯
6Block 資料處理贊助商
Fish Audio 在 Lepton.AI 上提供