Voice-Pro: A melhor interface web gradio para transcrição, tradução e conversão de texto em fala?
? 한국어 ∙ Inglês ∙ 中文简体 ∙ 中文繁體 ∙ 日本語
Voice-Pro é a melhor interface web gradio para transcrição, tradução e conversão de texto em fala. Pode ser facilmente instalado com um clique. Crie um ambiente virtual usando Miniconda, rodando completamente separado do sistema Windows (totalmente portátil). Suporta transcrição e tradução em tempo real, bem como modo em lote.
- YouTube Downloader : Você pode baixar vídeos do YouTube e extrair o áudio (mp3, wav, flac).
- Removedor Vocal : Use MDX-Net suportado em UVR5 e o mecanismo Demucs desenvolvido pela Meta para separação de voz.
- STT : Suporta conversão de fala em texto com Whisper, Faster-Whisper e sussurro com registro de data e hora.
- Tradutor : Google Tradutor.
- TTS : Texto para fala. Borda-TTS, F5-TTS.
- mais...
? Tela de execução
Guia TTS
: Produção de podcast usando F5-TTS
f5-tts-demo-elon-zuckerberg-1115-3.mp4
Guia Studio
: transcrição, tradução e conversão de texto em fala
voz-pro-demo-v1.5.7-hevc-720p.mp4
Principais recursos
- Guia
Studio
- Fornece ambiente integrado para downloader do YouTube, remoção de ruído, legendas, tradução e TTS
- Todos os formatos de vídeo/áudio suportados pelo ffmpeg podem ser usados
- Formato de áudio de saída selecionável (wav, flac, mp3)
- Reconhecimento de fala e criação de legendas para 100 idiomas
- Selecione opções de criação de legendas adequadas ao desempenho do PC (Whisper Model & Compute Type)
- Tradução para mais de 100 idiomas e geração de voz através de TTS
- A música de fundo e os efeitos sonoros do vídeo original são mantidos no vídeo multilíngue.
- Suporta velocidade de voz TTS, volume e ajuste de tom
Guia Whisper Caption
- Uma aba dedicada à criação de legendas. Suporta mais de 90 idiomas
- Exibir legendas criadas com o vídeo
- Função de destaque de nível mundial fornecida
- Função Denoise fornecida (1-Demucs, 2-MDXNet)
Guia Translate
- Guia dedicada para tradução. Suporta mais de 100 idiomas
- Suporta arquivos de legenda (ass, ssa, srt, mpl2, tmp, vtt, microdvd, json)
- A entrada direta de texto também é possível
- Detecta automaticamente o idioma dos arquivos enviados
Guia TTS
- Edge-TTS e F5-TTS são suportados.
- Edge-TTS suporta mais de 100 idiomas e mais de 400 vozes.
- Tom, volume e velocidade podem ser ajustados.
- F5-TTS suporta clonagem de voz Zero-Shot.
- Você pode criar podcasts usando Celeb Voices.
Guia Live Translation
- Reconhecimento de voz em tempo real e suporte para tradução
- Selecione a fonte de entrada de áudio, como microfone, alto-falante, etc.
- Oferece a capacidade de salvar áudio capturado, legendas reconhecidas e legendas traduzidas
Batch
Lote
- Processamento em lote para grandes quantidades de arquivos
- Legendas, tradução, TTS
Ambiente de execução
- SO: Windows 10/11 (64 bits) ※ Linux e Mac OS não são suportados.
- GPU: Placa gráfica NVIDIA com suporte para CUDA 12.1 recomendada.
- VRAM: 4 GB ou mais. 8 GB ou mais recomendado.
- RAM: 4 GB ou mais
- HDD: Pelo menos 20 GB de espaço livre durante a instalação
- É necessária conexão com a Internet (trabalho de instalação e tradução)
? Instalação
Voice-Pro pode ser facilmente instalado com um clique. Basta executar configure.bat e start.bat
passo 1. Preparação do pacote
- A. Versão paga
- Descompacte o arquivo compactado ( voice-pro-x.zip ) incluído no USB em um local apropriado no seu computador.
- Ou copie a pasta já descompactada ( voice-pro-x ) para um local apropriado em seu computador.
- B. Versão gratuita
- Clone ou baixe a versão mais recente ( código-fonte (zip) ) em
etapa 2. Instale e execute o programa
- Execute
configure.bat
- Instale git, ffmpeg e CUDA (se estiver usando GPU NVIDIA) no Windows.
- Você só precisa executá-lo na primeira vez.
- É necessária uma conexão com a Internet e pode levar mais de uma hora dependendo do sistema.
- Nunca feche a janela de comando do Windows durante a instalação.
- Execute
start.bat
- Inicie o Voice-Pro. A UI da Web será executada automaticamente.
- Ao executar pela primeira vez, o Voice-Pro é instalado primeiro.
- É necessária uma conexão com a Internet e pode levar mais de uma hora dependendo do sistema.
- Nunca feche a janela de comando do Windows durante a instalação.
- Se ocorrer um problema durante a instalação, exclua a pasta installer_files e execute start.bat novamente.
etapa 3. Desinstalar programa
- Execute
uninstall.bat
:- Remova a pasta installer_files .
- Remova os pacotes ffmepg, git e CUDA instalados no Windows (se selecionado)
- Voice-Pro possui instalação portátil como padrão. Para desinstalar o programa, basta excluir a pasta de instalação.
❓Dicas e truques
Se o navegador não for executado automaticamente
- Feche a janela do Windows-Commnad e execute start.bat novamente.
- Execute o navegador diretamente e digite o endereço exibido na janela de comando do Windows (por exemplo, http://127.0.0.1:7892 ) na barra de endereço.
Se ocorrer um erro CUDA Out-Of-Memory
- Verifique o status da memória GPU no Gerenciador de Tarefas do Windows - guia Desempenho.
- Defina o nível de redução de ruído como 0 ou 1. O nível de redução de ruído 2 requer pelo menos 8 GB de memória GPU.
- Defina o tipo de computação como tipo int. O tipo float tem melhor qualidade, mas requer mais memória GPU.
Como melhorar a qualidade das legendas?
- A qualidade das legendas tende a melhorar com modelos Whisper maiores, mas não é necessariamente o caso. grande > médio > pequeno > base > minúsculo
- Entre os tipos de computação, o tipo float tem bom desempenho. O tipo int é um modelo que reduz o uso da GPU e aumenta a velocidade por meio da quantização do modelo. Por outro lado, o desempenho diminui.
- Se você aumentar o nível de redução de ruído, mais sons de fundo serão removidos e apenas a voz restante será usada para reconhecimento de voz. Nem sempre garante bons resultados.
? Cuidado
O Windows Defender pode emitir um aviso sobre aplicativos não confiáveis e impedir a execução adicional do Voice-Pro. Se o nível de segurança do SmartScreen estiver definido como “Avisar”, basta clicar em “Mais informações” e depois em “Executar mesmo assim”. Se o SmartScreen estiver configurado para o nível "Bloquear", não haverá botão para executar a instalação. Neste caso, abra as propriedades do arquivo start.bat, marque "Desbloquear", aplique a alteração e execute novamente o start.bat.
Quando o Windows Defender reconhece erroneamente um arquivo em lote como um Trojan, isso geralmente é chamado de “falso positivo”. Para resolver esse problema, você pode seguir as seguintes etapas:
- Tratamento de exceções de arquivo: no Windows Defender, você pode definir determinados arquivos ou processos para ignorar a verificação de segurança. Para fazer isso, siga as etapas abaixo:
- Clique no botão ‘Iniciar’ e vá para ‘Configurações’.
- Clique em ‘Atualização e segurança’.
- Selecione ‘Segurança do Windows’ e vá para ‘Proteção contra vírus e ameaças’.
- Clique em 'Gerenciar configurações de proteção contra vírus e ameaças'.
- Selecione 'Adicionar exceção' em 'Configurações de proteção contra vírus e ameaças'.
- Selecione 'Arquivo ou Pasta', encontre o arquivo em lote em questão e adicione-o como uma exceção.
- Desative temporariamente o Windows Defender: esta pode ser uma solução temporária. No entanto, você deve ter cuidado ao usar esse método, pois ele pode expor seu computador a outras ameaças.
- Relate o problema ao software antivírus: Se tiver certeza de que o arquivo não é um cavalo de Tróia, você pode denunciá-lo à Microsoft como um falso positivo. A Microsoft analisará isso e tomará as medidas necessárias.
? Contate-nos
- e-mail: [email protected]
- página inicial (coreano): https://abuskorea.imweb.me
- Amazon (EUA): https://www.amazon.com/dp/B0DBR69JPL
- Amazon (Japão): https://www.amazon.co.jp/dp/B0DBVRJ542
- Amazon (Singapura): https://www.amazon.sg/dp/B0DCGKL8R4
- Amazon (Emirados Árabes Unidos): https://www.amazon.ae/dp/B0DCGKM7FF
- 네이버 스마트스토어 (S/W): https://smartstore.naver.com/abus/products/10385660040
- 네이버 스마트스토어 (Solução): https://smartstore.naver.com/abus/products/10298346364
? YouTube
- Informações do produto: https://youtube.com/playlist?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq&si=873MgzUtu4POE9jO
- Karaokê caseiro (Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9bVxfGo58U-R-w3fUHqwiD6&si=aWRDfF8TxFp2oAR0
- Karaokê caseiro (K-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9Z8kB01tQKfzTysaCCxC3C8&si=1_-9p722rd_JXpzv
- Karaokê caseiro (J-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9apyxrP9LE9PiT821G7lJXk&si=0a474CP7ZIjMoGN9
Créditos
- Demucs: https://github.com/facebookresearch/demucs
- yt-dlp: https://github.com/yt-dlp/yt-dlp
- gradio: https://github.com/gradio-app/gradio
- borda-TTS: https://github.com/rany2/edge-tts
- F5-TTS: https://github.com/SWivid/F5-TTS.git
©️ Direitos Autorais
da ABUS