Executáveis independentes do Whisper & mais rápido do Openai para aqueles que não querem se preocupar com Python.
Os executáveis mais rápidos são x86-64 compatíveis com o Windows 7, Linux v5.4, MacOS v10.15 e acima.
Os executáveis mais rápidos que são x86-64 compatíveis com o Windows 7, Linux v5.4 e acima.
Os executáveis do Whisper são x86-64 compatíveis com o Windows 7 e acima.
Destinado a ser usado na interface da linha de comando ou em programas como edição de legenda, tero subtitler, ffastrans, aviutl.
O mais rápido e mais rápido é muito mais rápido e melhor que o Whisper da Openai, e requer menos Ram/Vram.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Executíveis & Libs podem ser baixados de Releases
. [no lado direito desta página]
Não copie os programas para as pastas do Windows! [Corra como administrador se você o fez]
Os programas optarão automaticamente por trabalhar na GPU se o CUDA for detectado.
Para o uso decente da transcrição não menor que o modelo medium
.
Guia como executar os programas de linha de comando: https://www.youtube.com/watch?v=A3NWRCV-BTU
Vanilla sussurro, compilado como é - nenhuma alteração no código original.
Uma implementação de referência, desenvolvimento estagnado, caixa eletrônico talvez seja útil para alguns testes.
Alguns padrões são ajustados para transcrições de filmes e para torná -lo portátil.
Apresenta várias novas configurações e ajustes experimentais.
Mostra a barra de progresso na barra de título da interface da linha de comando. [ou pode ser impresso com -pp
]
Por padrão, ele procura modelos na mesma pasta, em caminho como este-> _modelsfaster-whisper-medium
.
Os modelos são baixados automaticamente ou podem ser baixados manualmente de: Systran & Purfview
Descontinuado. Use mais rápido que-xxl
Inclui todos os recursos independentes mais rápidos e mais rápidos + os adicionais, por exemplo:
Áudio de pré -processamento com MDX23 KIM_VOCAL_V2 Modelo de extração vocal.
Métodos Alternativos VAD: 'silero_v3', 'silero_v4', 'pyannote_v3', 'pyannote_onnx_v3', 'auditok', 'webrtc'.
Diarização do alto -falante.
Leia mais sobre novos recursos no tópico das discussões.