Download:
LocalVocal permite transcrever, localmente em sua máquina, fala em texto e traduzir simultaneamente para qualquer idioma. ✅ Sem necessidade de GPU, ✅ sem custos de nuvem, ✅ sem rede e ✅ sem tempo de inatividade! Privacidade em primeiro lugar - todos os dados permanecem na sua máquina.
Se este plugin gratuito foi valioso, considere adicionar um ⭐ a este repositório GH, classificá-lo no OBS, inscrever-se no meu canal do YouTube onde posto atualizações e apoiar meu trabalho no GitHub, Patreon ou OpenCollective?
Internamente, o plugin está executando o Whisper da OpenAI para processar a fala em tempo real e prever uma transcrição. Ele está usando o projeto Whisper.cpp de ggergganov para executar a rede Whisper com eficiência em CPUs e GPUs. A tradução é feita com CTranslate2.
Faça mais com LocalVocal:
Tradução em tempo real
Traduzir legenda de qualquer aplicativo
Tradução em tempo real com DeepL
Tradução em tempo real com OpenAI
ChatGPT + conversão de texto em fala
POSTAR legendas no YouTube
Tradução local LLM em tempo real
Tutorial de uso
Recursos atuais:
Transcreva áudio para texto em tempo real em 100 idiomas
Exibir legendas na tela usando fontes de texto
Envie legendas para um arquivo .txt ou .srt (para leitura por fontes externas ou reprodução de vídeo) com e sem opção de agregação
Legendas sincronizadas com carimbos de data e hora de gravação OBS
Envie legendas em um stream RTMP para, por exemplo, YouTube, Twitch
Traga seu próprio modelo Whisper (qualquer GGML)
Traduza legendas em tempo real para os principais idiomas (tradução integrada do Whisper e modelos NMT)
Suporte para aceleração CUDA, hipBLAS (AMD ROCm), Apple Arm64, AVX e SSE
Filtre ou substitua qualquer parte das legendas produzidas
Transcrições parciais para uma experiência de streaming de legendas
Centenas de modelos Whisper ajustados para dezenas de idiomas do HuggingFace
Roteiro:
Opções de tradução integradas mais robustas
Opções de saída adicionais: .vtt, .ssa, .sub, etc.
Diarização de alto-falante (detecção de alto-falantes em um fluxo de áudio com várias pessoas)
Confira nossos outros plug-ins:
A remoção de fundo remove o fundo da webcam sem uma tela verde.
Detect detectará e rastreará mais de 80 tipos de objetos em tempo real dentro do OBS
CleanStream para remoção de palavras de preenchimento (uh, hum) e palavrões em tempo real de uma transmissão de áudio ao vivo
Fonte URL/API que permite buscar dados ao vivo de uma API e exibi-los no OBS.
Squawk adiciona recursos locais realistas de conversão de texto em fala OBS integrado
Confira os lançamentos mais recentes para downloads e instruções de instalação.
O plugin vem com o modelo Tiny.en e fará download de outros modelos Whisper de forma autônoma por meio de um menu suspenso. Também existe a opção de selecionar um arquivo de modelo GGML Whisper externo, se você o tiver no disco.
Obtenha mais modelos em https://ggml.ggerganov.com/ e HuggingFace, siga as instruções em Whisper.cpp para criar seus próprios modelos ou baixar outros, como modelos destilados.
O plugin foi construído e testado em Mac OSX (Intel e Apple Silicon), Windows (com e sem Nvidia CUDA) e Linux.
Comece clonando este repositório em um diretório de sua escolha.
Usando os scripts de pipeline de CI, localmente você chamaria apenas o script zsh, que é construído para a arquitetura especificada em $MACOS_ARCH ( x86_64
ou arm64
).
$ MACOS_ARCH="x86_64" ./.github/scripts/build-macos -c Liberação
O script acima deve ser bem-sucedido e os arquivos do plugin (por exemplo, obs-localvocal.plugin
) residirão na pasta ./release/Release
fora da raiz. Copie o arquivo .plugin
para o diretório OBS, por exemplo, ~/Library/Application Support/obs-studio/plugins
.
Para obter o arquivo do instalador .pkg
, execute, por exemplo
$ ./.github/scripts/package-macos -c Liberação
(Observe que talvez as saídas estejam na pasta Release
e não na pasta install
como pakage-macos
espera, então você precisará renomear a pasta de build_x86_64/Release
para build_x86_64/install
)
Para construir com sucesso no Ubuntu, primeiro clone o repositório e depois a partir do diretório do repositório:
$ sudo apt install -y libssl-dev $ ./.github/scripts/build-linux
Copie os resultados para as pastas OBS padrão no Ubuntu
$ sudo cp -R release/RelWithDebInfo/lib/* /usr/lib/ $ sudo cp -R release/RelWithDebInfo/share/* /usr/share/
Nota: O guia oficial de plug-ins do OBS recomenda adicionar plug-ins à pasta ~/.config/obs-studio/plugins
. Isso tem a ver com a maneira como você instalou o OBS.
Caso o procedimento acima não funcione, tente copiar os arquivos para a pasta ~/.config
:
$ mkdir -p ~/.config/obs-studio/plugins/obs-localvocal/bin/64bit $ cp -R release/RelWithDebInfo/lib/x86_64-linux-gnu/obs-plugins/* ~/.config/obs-studio/plugins/obs-localvocal/bin/64bit/ $ mkdir -p ~/.config/obs-studio/plugins/obs-localvocal/data $ cp -R release/RelWithDebInfo/share/obs/obs-plugins/obs-localvocal/* ~/.config/obs-studio/plugins/obs-localvocal/data/
Para outras distros onde você não pode usar o script de construção de CI, você pode construir o plugin da seguinte maneira
Clone o repositório e instale estas dependências usando o gerenciador de pacotes da sua distribuição:
libssl (com cabeçalhos de desenvolvimento)
Gere os scripts de construção do CMake (ajuste as pastas, se necessário)
cmake -B build-dir --preset linux-x86_64 -DUSE_SYSTEM_CURL=ON -DCMAKE_INSTALL_PREFIX=./output_dir
Construa o plugin e copie os arquivos para o diretório de saída
cmake --build build-dir --target instalar
Copie o plugin para a pasta de plugins OBS
mkdir -p ~/.config/obs-studio/plugins/bin/64bit cp -R ./output_dir/lib/obs-plugins/* ~/.config/obs-studio/plugins/bin/64bit/
NB Dependendo do seu sistema, o plugin pode estar em
./output_dir/lib64/obs-plugins
.
Copie os dados do plugin para a pasta de plugins OBS - Possivelmente necessário apenas na primeira instalação
mkdir -p ~/.config/obs-studio/plugins/data cp -R ./output_dir/share/obs/obs-plugins/obs-localvocal/* ~/.config/obs-studio/plugins/data/
Use os scripts de CI novamente, por exemplo:
> .github/scripts/Build-Windows.ps1 -Lançamento de configuração
A compilação deve existir na pasta ./release
fora da raiz. Você pode instalar manualmente os arquivos no diretório OBS.
> Copy-Item -Recurse -Force "releaseRelease*" -Destination "C:Program Filesobs-studio"
LocalVocal agora será compilado com suporte CUDA automaticamente por meio de um binário pré-construído de Whisper.cpp em https://github.com/locaal-ai/locaal-ai-dep-whispercpp. Os scripts CMake baixarão todos os arquivos necessários.
Para construir com cuda adicione ACCELERATION
como uma variável de ambiente (com cpu
, hipblas
ou cuda
) e construa regularmente
> $env:ACCELERATION="cuda"> .github/scripts/Build-Windows.ps1 -Lançamento de configuração