對於那些不想打擾python的人來說,Openai的耳語和更快的狂歡者的獨立可執行文件。
更快的旋轉可執行文件與Windows 7,Linux V5.4,MacOS v10.15及更高版本兼容x86-64。
更快的Whisper-XXL可執行文件與Windows 7,Linux V5.4及以上兼容。
耳語可執行文件與Windows 7及更高版本兼容X86-64。
用於用於命令行界面或字幕編輯,tero subtitler,ffastrans,aviutl等程序中。
比Openai的耳語更快,更快,它需要更少的RAM/VRAM。
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
可執行文件和庫可以從Releases
中下載。 [在此頁面的右側]
不要將程序複製到Windows的文件夾! [如果您這樣做,以管理員的身份運行]
如果檢測到CUDA,程序將自動選擇在GPU上工作。
對於體面的轉錄,使用不小於medium
模型。
指南如何運行命令行程序:https://www.youtube.com/watch?v=a3nwrcv-btu
香草耳語,按原樣編譯 - 原始代碼沒有更改。
參考實現,停滯的開發,ATM可能對某些測試有用。
對電影轉錄進行了一些默認調整,並使其可移植。
具有各種新的實驗設置和調整。
在命令行接口標題欄中顯示進度欄。 [或可以用-pp
打印]
默認情況下,它在同一文件夾中查找模型,在這樣的路徑中 - > _modelsfaster-whisper-medium
。
模型是自動下載或可以手動下載的:Systran&Purfview
棄用。使用更快的Whisper-XXL
包括所有獨立的旋轉功能 +其他獨立功能,例如:
帶有MDX23的預處理音頻KIM_VOCAL_V2人聲提取模型。
替代VAD方法:“ silero_v3','silero_v4','pyannote_v3','pyannote_onnx_v3','auditok','webrtc'。
揚聲器診斷。
在討論線程中閱讀有關新功能的更多信息。