Esta é uma ferramenta de tradução e dublagem de vídeo que pode traduzir vídeos de um idioma para vídeos em um idioma específico e gerar e adicionar automaticamente legendas e dublagem nesse idioma. e suporta chamadas de API
O reconhecimento de fala suporta modelos off-line locais de sussurro faster-whisper
e openai-whisper
whisper e OpenAI SpeechToText API
GoogleSpeech
阿里中文语音识别模型
e modelo de bean bag, e suporta API de reconhecimento de fala personalizada.
A tradução de texto suporta微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
A fala de síntese de texto suporta Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
clone-voz ChatTTS-ui Fish TTS CosyVoice
Permite reter música de acompanhamento de fundo, etc. (com base em uvr5)
Idiomas suportados: chinês simplificado e tradicional, inglês, coreano, japonês, russo, francês, alemão, italiano, espanhol, português, vietnamita, tailandês, árabe, turco, húngaro, indiano, ucraniano, cazaque, indonésio, malaio, tcheco, polonês, Detecção automática opcional em holandês, sueco/outros idiomas
[Patrocinador]
302.AI é um supermercado de IA que reúne as principais marcas do mundo, com pagamento conforme o uso, zero mensalidade e limite zero para uso de vários tipos de IA.
Funções abrangentes/fácil de usar/limiar zero para pagamento sob demanda/separação de gerentes e usuários
[Traduzir vídeo e dublar automaticamente] Traduza o som do vídeo para dublagem em outro idioma e incorpore legendas nesse idioma
[Reconhecimento de fala/Converter áudio e vídeo em legendas] Pode reconhecer em lote vozes humanas em arquivos de áudio e vídeo como texto e exportá-los como arquivos de legenda srt
[Síntese de fala/dublagem de legendas] Crie dublagem com base em arquivos de legenda srt locais existentes, suportando legendas individuais ou em lote
[Traduzir arquivos de legenda] Traduza um ou mais arquivos de legenda srt em arquivos de legenda em outros idiomas
[Mesclar vídeo e áudio] Mesclar arquivos de vídeo e arquivos de áudio em lotes em correspondência um para um
[Mesclar vídeo e legendas srt] Mesclar arquivos de vídeo e arquivos de legenda srt em lote, um por um
[Adicionar marca d'água de imagem aos vídeos] Incorpore marcas d'água de imagem em arquivos de vídeo em lotes
【Extraia áudio do vídeo】Separe o vídeo em arquivos de áudio e vídeo silencioso
[Conversão de formato de áudio e vídeo] Converta formatos de áudio e vídeo em lotes
[Edição de legendas e exportação para vários formatos] Suporta importação de legendas nos formatos srt, vtt e ass Após a edição, você pode definir o estilo da fonte, cor, etc.
[Conversão de formato de legenda] Converta arquivos de legenda para formatos srt/ass/vtt em lotes
[Baixar vídeos do YouTube] Os vídeos podem ser baixados do YouTube
[Separação da música vocal de fundo]
[Chamada de API] Suporta síntese de fala, reconhecimento de idioma, tradução de legendas e chamadas de interface de tradução de vídeo
Use pyinstaller para empacotar sem antivírus e software antivírus pode relatar vírus. Adicione-o à lista de confiança ou use o código-fonte para implantação.
[Clique para baixar a versão pré-empacotada, descompacte-a em um diretório em inglês sem espaços e clique duas vezes em sp.exe (https://github.com/jianchang512/pyvideotrans/releases)
Descompacte-o em um caminho em inglês e o caminho não contém espaços. Após descompactar, clique duas vezes em sp.exe (se você encontrar problemas de permissão, clique com o botão direito e abra com direitos de administrador)
Nota: Ele deve ser descompactado antes do uso. Não pode ser clicado duas vezes diretamente no pacote compactado, nem o arquivo sp.exe pode ser movido para outros locais após a descompactação.
Abra uma janela de terminal e execute os seguintes comandos respectivamente:
Certifique-se de que o Homebrew esteja instalado antes de executar. Se você não tiver o Homebrew instalado, será necessário instalá-lo primeiro.
Execute o comando para instalar o Homebrew:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Após a conclusão da instalação, execute:
eval $(brew --config)
brew install libsndfile brew install ffmpeg brew install git brew install [email protected]
Continuar execução
export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
Crie uma pasta sem espaços e caracteres chineses e insira a pasta no terminal.
Execute o comando git clone https://github.com/jianchang512/pyvideotrans
no terminal
Execute o comando cd pyvideotrans
Continue executando python -m venv venv
Continue a executar o comando source ./venv/bin/activate
. Após a execução, verifique e confirme se o prompt de comando do terminal mudou para começar com (venv)
(venv)
.
Execute pip install -r requirements.txt
Se o prompt falhar, execute os 2 comandos a seguir para mudar a imagem pip para a imagem Alibaba.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Em seguida, execute-o novamente. Se você mudou para a fonte da imagem Alibaba e ainda assim falhar, tente executar pip install -r requirements.txt
python sp.py
abre a interface do software
O sistema CentOS/RHEL executa os seguintes comandos para instalar o python3.10
sudo yum update sudo yum groupinstall "Development Tools" sudo yum install openssl-devel bzip2-devel libffi-devel cd /tmp wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz tar xzf Python-3.10.4.tgz cd Python-3.10.4 ./configure — enable-optimizations sudo make && sudo make install sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1 sudo yum install -y ffmpeg
Para sistema Ubuntu/Debian, execute o seguinte comando para instalar python3.10
apt update && apt upgrade -y apt install software-properties-common -y add-apt-repository ppa:deadsnakes/ppa apt update sudo apt-get install libxcb-cursor0 apt install python3.10 curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10 sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10 1 sudo update-alternatives --config python apt-get install ffmpeg
Abra qualquer terminal e execute python3 -V
. Se "3.10.4" for exibido, a instalação foi bem-sucedida, caso contrário, falhará.
Crie uma pasta sem espaços e caracteres chineses e abra a pasta no terminal.
Execute o comando git clone https://github.com/jianchang512/pyvideotrans
no terminal
Continue executando o comando cd pyvideotrans
Continue executando python -m venv venv
Continue a executar o comando source ./venv/bin/activate
. Após a execução, verifique e confirme se o prompt de comando do terminal mudou para começar com (venv)
(venv)
.
Execute pip install -r requirements.txt
Se o prompt falhar, execute os 2 comandos a seguir para mudar a imagem pip para a imagem Alibaba.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Em seguida, execute-o novamente. Se você mudou para a fonte da imagem Alibaba e ainda assim falhou, tente pip install -r requirements.txt
Se você quiser usar aceleração CUDA, execute-a separadamente
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
linux Se você deseja habilitar a aceleração CUDA, você deve ter uma placa gráfica NVIDIA e configurar o ambiente CUDA11.8+. Procure por "instalação Linux CUDA".
python sp.py
abre a interface do software
Abra https://www.python.org/downloads/ para baixar o Windows 3.10. Após o download, clique duas vezes e clique em Avançar.
Abra um cmd e execute python -V
. Se a saída não for 3.10.4
, significa que há um erro de instalação ou Add to PATH
não foi adicionado.
Abra https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe, baixe o git e clique duas vezes no próximo etapa após o download.
Encontre uma pasta sem espaços e caracteres chineses, digite cmd
na barra de endereço e pressione Enter, abra o terminal e execute os seguintes comandos no terminal
Execute o comando git clone https://github.com/jianchang512/pyvideotrans
Continue executando o comando cd pyvideotrans
Continue executando python -m venv venv
Continue a executar o comando .venvscriptsactivate
. Após a execução, verifique para confirmar se o início da linha de comando mudou para (venv)
, caso contrário ocorreu um erro.
Execute pip install -r requirements.txt
Se o prompt falhar, execute os 2 comandos a seguir para mudar a imagem pip para a imagem Alibaba.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Em seguida, execute-o novamente. Se você mudou para a fonte da imagem Alibaba e ainda assim falhou, tente pip install -r requirements.txt
Se você quiser usar aceleração CUDA, execute-a separadamente
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
Windows Se desejar ativar a aceleração CUDA, você deverá ter uma placa gráfica NVIDIA e configurar o ambiente CUDA11.8+. Para instalação específica, consulte Suporte à aceleração CUDA.
Descompacte ffmpeg.zip no diretório do código-fonte atual. Se for solicitado a substituir, substitua. Após a descompactação, certifique-se de que ffmpeg.exe ffprobe.exe ytwin32.exe possa ser visto na pasta ffmepg no código-fonte.
python sp.py
abre a interface do software
A versão 4.x do ctranslate2 é usada por padrão e suporta apenas a versão CUDA12.x. Se o seu cuda for inferior a 12 e não puder atualizar o cuda para 12.x, execute o comando para desinstalar o ctranslate2 e reinstalá-lo.
pip uninstall -y ctranslate2 pip install ctranslate2==3.24.0
Você pode encontrar erros como xx module not found
. Abra o arquivo require.txt, procure o módulo xx e remova == após xx e o número da versão depois de um tempo.
Implantação de código-fonte/estação b no Mac
Como configurar a tradução de vídeo usando Gemini Api/station b
Como baixar e instalar
ChatTTS-ui: interface UI usando ChatTTS para sintetizar sons
OTT: ferramenta local de tradução de texto offline
Ferramenta de clonagem de voz: sintetize fala com qualquer timbre
Ferramenta de reconhecimento de fala: reconhecimento de fala offline local para ferramenta de texto
Separação de música de fundo vocal: ferramenta de separação de música de fundo e vocal
Versão melhorada de api.py do GPT-SoVITS
api.py adaptado para CosyVoice
Alguns projetos de código aberto nos quais este programa depende principalmente
ffmpeg
PySide6
edge-tts
sussurro mais rápido
openai-sussurro
pydub