? Estou trabalhando em uma reescrita completa do projeto. O progresso nisso pode ser visto na filial v4. Consequentemente, esta filial não receberá novos lançamentos ou atualizações.
whishper é um pacote de transcrição e legendagem de áudio 100% local de código aberto com uma interface da web completa.
Características
Transcreva qualquer mídia para texto: áudio, vídeo, etc.
Transcreva de URLs (qualquer fonte compatível com yt-dlp).
Carregue um arquivo para transcrever.
? Baixe transcrições em vários formatos : TXT, JSON, VTT, SRT ou copie o texto bruto para sua área de transferência.
Traduza suas transcrições para qualquer idioma suportado pelo Libretranslate.
✍️ Editor de legendas poderoso para que você não precise sair da IU!
Destaque da transcrição com base na posição da mídia.
Avisos de CPS (caracteres por segundo).
Divisão de segmentos.
Inserção de segmento.
Seleção do idioma da legenda.
? 100% Local : transcrição, tradução e edição de legendas acontecem 100% na sua máquina (pode até funcionar offline!).
Rápido : usa FasterWhisper como backend do Whisper: obtenha tempos de transcrição muito mais rápidos na CPU!
? Configuração rápida e fácil : use o script de início rápido ou execute algumas etapas!
Suporte de GPU : use sua GPU NVIDIA para obter tempos de transcrição ainda mais rápidos!
? Suporte de CPU : sem GPU? Sem problemas! whishper também pode ser executado na CPU.
Roteiro
Pasta local como entrada de mídia (#15).
Pesquisa de texto completo em todas as transcrições.
Autenticação do usuário.
Gravação de áudio do navegador.
Adicione sussurro incrivelmente rápido como back-end opcional (# 53).
Suporte para aceleração de GPU.
Suporte a GPU não NVIDIA. É possível com sussurro mais rápido?
Podemos fazer algo com a comunicação perfeita?
Estrutura do projeto
whishper é uma coleção de peças que funcionam juntas. As três peças principais são:
API de transcrição: Esta é a API que permite a execução do Faster-Whisper. Você pode encontrá-lo na pasta transcription-api .
whishper -Backend: Este é o backend que coordena chamadas de frontend, banco de dados e tarefas. Você pode encontrá-lo na pasta backend .
whishper -Frontend: Este é o frontend (web UI) do aplicativo. Você pode encontrá-lo na pasta frontend .
Tradução (terceiros): Este é o contêiner libretranslate usado para traduzir legendas.
MongoDB (terceiro): Este é o banco de dados que armazena todas as informações sobre suas transcrições.
Nginx (3ª parte): Este é o proxy que permite rodar tudo a partir de um único domínio.
Contribuindo
Contribuições são bem-vindas! Sinta-se à vontade para abrir um PR com suas alterações ou dar uma olhada nos problemas para ver se há algo em que você possa ajudar.
Configuração de desenvolvimento
Confira a documentação de desenvolvimento aqui.
Capturas de tela
Essas capturas de tela estão disponíveis no site oficial, clique em qualquer um dos links a seguir para ver: