Voice-Pro: лучший веб-интерфейс Gradio для транскрипции, перевода и преобразования текста в речь?
? 한국어 ∙ английский ∙ 中文简体 ∙ 中文繁體 ∙ 日本語
Voice-Pro — лучший веб-интерфейс Gradio для транскрипции, перевода и преобразования текста в речь. Его можно легко установить одним щелчком мыши. Создайте виртуальную среду с помощью Miniconda, работающую полностью отдельно от системы Windows (полностью переносимую). Поддерживает транскрипцию и перевод в реальном времени, а также пакетный режим.
- YouTube Downloader : вы можете загружать видео с YouTube и извлекать аудио (mp3, wav, flac).
- Vocal Remover : используйте MDX-Net, поддерживаемый в UVR5, и движок Demucs, разработанный Meta, для разделения голоса.
- STT : поддерживает преобразование речи в текст с помощью Whisper, Faster-Whisper и временной метки шепота.
- Переводчик : Google-переводчик.
- TTS : Преобразование текста в речь. Край-ТТС, F5-ТТС.
- более...
? Экран запуска
Вкладка TTS
: Производство подкастов с помощью F5-TTS.
f5-tts-demo-elon-zuckerberg-1115-3.mp4
Вкладка Studio
: транскрипция, перевод и преобразование текста в речь.
voice-pro-demo-v1.5.7-hevc-720p.mp4
Ключевые особенности
- Вкладка
Studio
»- Обеспечивает интегрированную среду для загрузки YouTube, удаления шума, субтитров, перевода и TTS.
- Можно использовать все видео/аудио форматы, поддерживаемые ffmpeg.
- Выбираемый выходной аудиоформат (wav, flac, mp3)
- Распознавание речи и создание субтитров для 100 языков.
- Выберите параметры создания субтитров, подходящие для производительности ПК (модель Whisper и тип вычислений)
- Перевод на более чем 100 языков и генерация голоса посредством TTS
- Фоновая музыка и звуковые эффекты из исходного видео сохраняются в многоязычном видео.
- Поддерживает настройку скорости, громкости и высоты голоса TTS.
Вкладка Whisper Caption
- Вкладка, посвященная созданию субтитров. Поддерживает более 90 языков
- Отображать субтитры, созданные вместе с видео
- Предусмотрена функция выделения мирового уровня
- Предусмотрена функция шумоподавления (1-Demucs, 2-MDXNet)
Вкладка Translate
- Отдельная вкладка для перевода. Поддерживает более 100 языков
- Поддерживает файлы субтитров (ass, ssa, srt, mpl2, tmp, vtt, microdvd, json)
- Также возможен прямой ввод текста.
- Автоматически определяет язык загружаемых файлов
Вкладка TTS
- Поддерживаются Edge-TTS и F5-TTS.
- Edge-TTS поддерживает более 100 языков и более 400 голосов.
- Шаг, громкость и скорость можно регулировать.
- F5-TTS поддерживает клонирование голоса с нулевым выстрелом.
- Вы можете создавать подкасты с помощью Celeb Voices.
Вкладка Live Translation
- Распознавание голоса в реальном времени и поддержка перевода
- Выберите источник аудиовхода, например микрофон, динамик и т. д.
- Предоставляет возможность сохранять захваченный звук, распознанные субтитры и переведенные субтитры.
Вкладка Batch
- Пакетная обработка больших объемов файлов
- Субтитры, перевод, TTS
Среда выполнения
- ОС: Windows 10/11 (64 бита) ※ Linux и Mac OS не поддерживаются.
- Графический процессор: рекомендуется видеокарта NVIDIA с поддержкой CUDA 12.1.
- Видеопамять: 4 ГБ или больше. Рекомендуется 8 ГБ или более.
- Оперативная память: 4 ГБ или больше
- Жесткий диск: не менее 20 ГБ свободного места во время установки.
- Требуется подключение к Интернету (работа по установке и переводу)
? Установка
Voice-Pro можно легко установить одним щелчком мыши. Просто запустите configure.bat и start.bat.
шаг 1. Подготовка упаковки
- А. Платная версия
- Разархивируйте сжатый файл ( voice-pro-x.zip ), включенный в USB-накопитель, в подходящее место на вашем компьютере.
- Или скопируйте уже разархивированную папку ( voice-pro-x ) в подходящее место на вашем компьютере.
- Б. Бесплатная версия
- Клонируйте или загрузите последнюю версию ( Исходный код (zip) ) с сайта
шаг 2. Установите и запустите программу
- Запустите
configure.bat
- Установите git, ffmpeg и CUDA (если используется графический процессор NVIDIA) в Windows.
- Вам нужно запустить его только в первый раз.
- Требуется подключение к Интернету. Это может занять более часа в зависимости от системы.
- Никогда не закрывайте окно команд Windows во время установки.
- Запустите
start.bat
- Запустите Голос-Про. Веб-интерфейс запустится автоматически.
- При первом запуске сначала устанавливается Voice-Pro.
- Требуется подключение к Интернету. Это может занять более часа в зависимости от системы.
- Никогда не закрывайте окно команд Windows во время установки.
- Если во время установки возникла проблема, удалите папку installer_files и снова запустите start.bat.
шаг 3. Удалить программу
- Запустите
uninstall.bat
:- Удалите папку installer_files .
- Удалите пакеты ffmepg, git и CUDA, установленные в Windows (если они выбраны).
- Voice-Pro в стандартной комплектации имеет портативную установку. Для удаления программы достаточно удалить папку установки.
❓Советы и рекомендации
Если браузер не запускается автоматически
- Закройте окно Windows-Commnad и снова запустите start.bat.
- Запустите браузер напрямую и введите адрес, отображаемый в окне команд Windows (например, http://127.0.0.1:7892 ), в адресной строке.
Если возникает ошибка CUDA Out-Of-Memory
- Проверьте состояние памяти графического процессора в диспетчере задач Windows — вкладка «Производительность».
- Установите уровень шумоподавления на 0 или 1. Для уровня шумоподавления 2 требуется не менее 8 ГБ памяти графического процессора.
- Установите для типа вычислений значение int. Тип float имеет лучшее качество, но требует больше памяти графического процессора.
Как улучшить качество субтитров?
- Качество субтитров имеет тенденцию улучшаться при использовании более крупных моделей Whisper, но это не обязательно так. большой > средний > маленький > базовый > крошечный
- Среди типов вычислений хорошую производительность имеет тип float. Тип int — это модель, которая снижает использование графического процессора и увеличивает скорость за счет квантования модели. С другой стороны, производительность снижается.
- Если вы увеличите уровень шумоподавления, больше фоновых звуков будет удалено, и для распознавания голоса будет использоваться только оставшийся голос. Это не всегда гарантирует хороший результат.
? осторожность
Защитник Windows может выдать предупреждение о ненадежном приложении и запретить дальнейшее выполнение Voice-Pro. Если уровень безопасности SmartScreen установлен на «Предупреждать», просто нажмите «Подробнее», а затем нажмите «Все равно запустить». Если для SmartScreen установлен уровень «Блокировать», кнопки для запуска установки не будет. В этом случае откройте свойства файла start.bat и установите флажок «Разблокировать», примените изменения и снова запустите start.bat.
Когда Защитник Windows ошибочно распознает командный файл как троянскую программу, это часто называют «ложным срабатыванием». Чтобы решить эту проблему, вы можете выполнить следующие шаги:
- Обработка исключений файлов. В Защитнике Windows вы можете настроить определенные файлы или процессы на пропуск сканирования безопасности. Для этого выполните следующие действия:
- Нажмите кнопку «Пуск» и перейдите в «Настройки».
- Нажмите «Обновление и безопасность».
- Выберите «Безопасность Windows» и перейдите в «Защита от вирусов и угроз».
- Нажмите «Управление настройками защиты от вирусов и угроз».
- В разделе «Настройки защиты от вирусов и угроз» выберите «Добавить исключение».
- Выберите «Файл или папка», найдите соответствующий пакетный файл и добавьте его в исключение.
- Временно отключите Защитника Windows: это может быть временным решением. Однако вы должны быть осторожны при использовании этого метода, поскольку он может подвергнуть ваш компьютер другим угрозам.
- Сообщите о проблеме антивирусному программному обеспечению. Если вы уверены, что файл не является троянским конем, вы можете сообщить о нем в Microsoft как о ложном срабатывании. Microsoft рассмотрит это и предпримет все необходимые действия.
? Связаться с нами
- электронная почта: [email protected]
- Домашняя страница (корейский): https://abuskorea.imweb.me
- Amazon (США): https://www.amazon.com/dp/B0DBR69JPL
- Amazon (Япония): https://www.amazon.co.jp/dp/B0DBVRJ542
- Amazon (Сингапур): https://www.amazon.sg/dp/B0DCGKL8R4
- Amazon (ОАЭ): https://www.amazon.ae/dp/B0DCGKM7FF
- 네이버 스마트스토어 (ПО): https://smartstore.naver.com/abus/products/10385660040
- 네이버 스마트스토어 (Решение): https://smartstore.naver.com/abus/products/10298346364
? Ютуб
- Информация о продукте: https://youtube.com/playlist?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq&si=873MgzUtu4POE9jO.
- Домашнее караоке (поп): https://youtube.com/playlist?list=PLwx5dnMDVC9bVxfGo58U-R-w3fUHqwiD6&si=aWRDfF8TxFp2oAR0
- Домашнее караоке (K-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9Z8kB01tQKfzTysaCCxC3C8&si=1_-9p722rd_JXpzv
- Домашнее караоке (J-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9apyxrP9LE9PiT821G7lJXk&si=0a474CP7ZIjMoGN9
Кредиты
- Демукс: https://github.com/facebookresearch/demucs
- yt-dlp: https://github.com/yt-dlp/yt-dlp
- градиент: https://github.com/gradio-app/gradio
- край-TTS: https://github.com/rany2/edge-tts
- F5-TTS: https://github.com/SWivid/F5-TTS.git
©️ Авторские права
от ABUS