Standalone Executables von Openai's Whisper & schnellerem Whisper für diejenigen, die sich nicht um Python kümmern wollen.
Schnellere Ausführungsfähigkeiten sind x86-64 kompatibel mit Windows 7, Linux v5.4, macOS v10.15 und höher.
Feder-Whisper-XXL- ausführbare Sendungen sind x86-64 kompatibel mit Windows 7, Linux v5.4 und höher.
Whisper Executables sind x86-64 kompatibel mit Windows 7 und höher.
Für die Befehlszeilenschnittstelle oder in Programmen wie Untertitel Edit, TO-Subtitler, ffastrans, aviutl verwendet werden.
Schneller ist viel schneller und besser als das Flüstern von Openai und es erfordert weniger RAM/VRAM.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Executables & Libs können aus Releases
heruntergeladen werden. [Auf der rechten Seite dieser Seite]
Kopieren Sie keine Programme in die Windows -Ordner! [Führen Sie als Administrator aus, wenn Sie es getan haben]
Programme werden automatisch für die Arbeit an GPU arbeiten, wenn CUDA erkannt wird.
Für anständige Transkriptionsmodell nicht kleiner als medium
.
Leitfaden zum Ausführen der Befehlszeilenprogramme: https://www.youtube.com/watch?v=A3nwrcv-btu
Vanilla Whisper, kompiliert wie es ist - keine Änderungen am ursprünglichen Code.
Eine Referenzimplementierung, stagnierende Entwicklung, ATM für einige Tests nützlich.
Einige Standardeinstellungen sind für Filme Transkriptionen optimiert und machen es tragbar.
Verfügt über verschiedene neue experimentelle Einstellungen und Optimierungen.
Zeigt die Fortschrittsleiste in der Titelleiste der Befehlszeilenschnittstelle an. [Oder es kann mit -pp
gedruckt werden]
Standardmäßig sucht es nach Modellen im selben Ordner, im Pfad wie diesen-> _modelsfaster-whisper-medium
.
Modelle werden automatisch heruntergeladen oder können manuell heruntergeladen werden: Systran & PurfView
Veraltet. Verwenden Sie schneller-Whisper-xxl
Enthält alle eigenständigen Features und zusätzlichen Merkmale, beispielsweise die zusätzlichen Merkmale, beispielsweise:
Preprocess -Audio mit MDX23 KIM_VOCAL_V2 Vokalextraktionsmodell.
Alternative VAD -Methoden: 'Silero_v3', 'silero_v4', 'pyannote_v3', 'pyannote_onnx_v3', 'auditok', 'webrtc'.
Sprecherdurchfall.
Lesen Sie mehr über neue Funktionen im Diskussionsthread.