英语| 简体中文 |葡萄牙语 | 日本语 | 한국어
此代码库和所有模型均根据 CC-BY-NC-SA-4.0 许可证发布。请参阅许可证了解更多详细信息。
零样本和少样本 TTS:输入 10 到 30 秒的声音样本以生成高质量的 TTS 输出。有关详细指南,请参阅语音克隆最佳实践。
多语言和跨语言支持:只需将多语言文本复制并粘贴到输入框中即可,无需担心语言问题。目前支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
无音素依赖:模型泛化能力强,不依赖音素进行TTS。它可以处理任何语言脚本中的文本。
高度准确: 5 分钟英文文本的 CER(字符错误率)和 WER(单词错误率)较低,约为 2%。
快速:通过 Fish-Tech 加速,Nvidia RTX 4060 笔记本电脑上的实时系数约为 1:5,Nvidia RTX 4090 上的实时系数约为 1:15。
WebUI 推理:具有易于使用、基于 Gradio 的 Web UI,与 Chrome、Firefox、Edge 和其他浏览器兼容。
GUI 推理:提供与 API 服务器无缝协作的 PyQt6 图形界面。支持 Linux、Windows 和 macOS。参见图形用户界面。
部署友好:轻松设置推理服务器,提供对 Linux、Windows 和 MacOS 的本机支持,最大限度地减少速度损失。
对于任何非法使用代码库的行为,我们不承担任何责任。请参阅您当地有关 DMCA 的法律和其他相关法律。
鱼音频
推理.ipynb
英语
中文
日本语
葡萄牙语(巴西)
英语
中文
日本语
葡萄牙语(巴西)
VITS2(丹尼尔·罗布尼科夫)
伯特-VITS2
GPT 维特斯
MQTTS
GPT 快速
GPT-苏联
6Block 数据处理赞助商
Fish Audio 在 Lepton.AI 上提供