английский | 简体中文 | Португальский | 日本語 | 한국어
Эта база кода и все модели выпускаются под лицензией CC-BY-NC-SA-4.0. Пожалуйста, обратитесь к ЛИЦЕНЗИИ для более подробной информации.
TTS с нулевым и малым количеством кадров: введите вокальный сэмпл продолжительностью от 10 до 30 секунд для создания высококачественного TTS-выхода. Подробные рекомендации см. в разделе «Рекомендации по клонированию голоса».
Многоязычная и межъязыковая поддержка: просто скопируйте и вставьте многоязычный текст в поле ввода — не нужно беспокоиться о языке. В настоящее время поддерживает английский, японский, корейский, китайский, французский, немецкий, арабский и испанский языки.
Отсутствие зависимости от фонем: модель обладает сильными возможностями обобщения и не полагается на фонемы для TTS. Он может обрабатывать текст на любом языке.
Высокая точность: достигается низкий уровень CER (частота ошибок в символах) и WER (частота ошибок в словах), составляющий около 2 % для 5-минутных текстов на английском языке.
Быстро: благодаря ускорению Fish-Tech коэффициент реального времени составляет примерно 1:5 на ноутбуке Nvidia RTX 4060 и 1:15 на Nvidia RTX 4090.
Вывод WebUI: имеет простой в использовании веб-интерфейс на основе Gradio, совместимый с Chrome, Firefox, Edge и другими браузерами.
Вывод GUI: предлагает графический интерфейс PyQt6, который без проблем работает с сервером API. Поддерживает Linux, Windows и macOS. См. графический интерфейс.
Удобство развертывания: легко настроить сервер вывода со встроенной поддержкой Linux, Windows и MacOS, что сводит к минимуму потерю скорости.
Мы не несем никакой ответственности за любое незаконное использование кодовой базы. Пожалуйста, ознакомьтесь с местными законами о DMCA и другими соответствующими законами.
Рыба Аудио
inference.ipynb
Английский
中文
日本語
Португальский (Бразилия)
Английский
中文
日本語
Португальский (Бразилия)
ВИТС2 (даниилробников)
Берт-ВИТС2
ГПТ ВИТС
MQTTS
GPT быстрый
ГПТ-СовИЦ
Спонсор обработки данных от 6Block
Fish Audio обслуживается на Lepton.AI.