Les exécutables autonomes de Whisper d'Openai et plus rapide pour ceux qui ne veulent pas se soucier de Python.
Les exécutables plus rapides sont compatibles x86-64 avec Windows 7, Linux V5.4, MacOS V10.15 et supérieur.
Les exécutables plus rapides-whisper-xxl sont compatibles x86-64 avec Windows 7, Linux V5.4 et supérieur.
Les exécutables Whisper sont compatibles x86-64 avec Windows 7 et au-dessus.
Destiné à être utilisé dans une interface de ligne de commande ou dans des programmes comme Subtitle Edit, Tero Subtitler, Ffastrans, AviUtl.
Plus rapide, c'est beaucoup plus rapide et meilleur que le chuchotement d'Openai, et il nécessite moins de RAM / VRAM.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Les exécutables et les LIB peuvent être téléchargés à partir Releases
. [sur le côté droit de cette page]
Ne copiez pas les programmes dans les dossiers de Windows! [Exécutez en tant qu'administrateur si vous l'avez fait]
Les programmes choisiront automatiquement de travailler sur GPU si CUDA est détecté.
Pour une transcription décente, une utilisation non plus petite que le modèle medium
.
Guide comment exécuter les programmes de ligne de commande: https://www.youtube.com/watch?v=a3nwrcv-btu
Vanilla Whisper, compilée telle quelle - aucune modification du code d'origine.
Une implémentation de référence, un développement stagnant, un ATM peut-être utile pour certains tests.
Certains défauts sont modifiés pour les transcriptions de films et pour le rendre portable.
Comprend divers nouveaux paramètres expérimentaux et ajustements.
Affiche la barre de progression dans la barre de titre de l'interface de ligne de commande. [ou il peut être imprimé avec -pp
]
Par défaut, il recherche des modèles dans le même dossier, dans un chemin comme celui-ci -> _modelsfaster-whisper-medium
.
Les modèles sont téléchargés automatiquement ou peuvent être téléchargés manuellement à partir de: Systran & Purfview
Déprécié. Utilisez plus rapidement-whisper-xxl
Inclut toutes les fonctionnalités autonomes de Whisper + celles supplémentaires, par exemple:
Audio prétraitement avec MDX23 KIM_VOCAL_V2 Modèle d'extraction vocale.
Méthodes VAD alternatives: 'SILERO_V3', 'SILERO_V4', 'PYANNOTE_V3', 'PYANNOTE_ONNX_V3', 'AUDITOK', 'WEBRTC'.
Diarization du haut-parleur.
En savoir plus sur les nouvelles fonctionnalités du fil des discussions.