Ejecutables independientes de Whisper y Whisper más rápido para aquellos que no quieren molestarse con Python.
Los ejecutables más rápidos son X86-64 compatibles con Windows 7, Linux V5.4, MacOS V10.15 y superior.
Los ejecutables más rápidos de Whisper-XXL son X86-64 compatibles con Windows 7, Linux v5.4 y arriba.
Los ejecutables de Whisper son X86-64 compatibles con Windows 7 y superior.
Destinado a ser utilizado en la interfaz de línea de comandos o en programas como Subtitle Edit, Tero Subtitler, Ffastrans, Aviutl.
Whisper más rápido es mucho más rápido y mejor que el susurro de Openai, y requiere menos RAM/VRAM.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Ejecutables y libs se pueden descargar de Releases
. [En el lado derecho de esta página]
¡No copie programas en las carpetas de Windows! [Ejecutar como administrador si lo hiciera]
Los programas elegirán automáticamente trabajar en GPU si se detecta CUDA.
Para una transcripción decente, el uso no es más pequeño que el modelo medium
.
Guía Cómo ejecutar los programas de línea de comando: https://www.youtube.com/watch?v=a3nwrcv-btu
Vanilla Whisper, compilado como está, sin cambios en el código original.
Una implementación de referencia, desarrollo estancado, cajero automático quizás útil para algunas pruebas.
Algunos valores predeterminados se ajustan para las transcripciones de películas y para hacerlo portátil.
Cuenta con varias nuevas configuraciones y ajustes experimentales.
Muestra la barra de progreso en la interfaz de la línea de comandos de título. [o se puede imprimir con -pp
]
Por defecto, busca modelos en la misma carpeta, en una ruta como esta-> _modelsfaster-whisper-medium
.
Los modelos se descargan automáticamente o se pueden descargar manualmente desde: Systran & Purfview
Desapercibido. Use más rápido
Incluye todas las características independientes más rápidas + las adicionales, por ejemplo:
Audio de preprocesos con MDX23 KIM_VOCAL_V2 Modelo de extracción vocal.
Métodos VAD alternativos: 'Silero_v3', 'Silero_v4', 'Pyannote_V3', 'Pyannote_onnx_v3', 'Auditok', 'WebRtc'.
Diarización del altavoz.
Lea más sobre nuevas características en el hilo de las discusiones.