对于那些不想打扰python的人来说,Openai的耳语和更快的狂欢者的独立可执行文件。
更快的旋转可执行文件与Windows 7,Linux V5.4,MacOS v10.15及更高版本兼容x86-64。
更快的Whisper-XXL可执行文件与Windows 7,Linux V5.4及以上兼容。
耳语可执行文件与Windows 7及更高版本兼容X86-64。
用于用于命令行界面或字幕编辑,tero subtitler,ffastrans,aviutl等程序中。
比Openai的耳语更快,更快,它需要更少的RAM/VRAM。
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
可执行文件和库可以从Releases
中下载。 [在此页面的右侧]
不要将程序复制到Windows的文件夹! [如果您这样做,以管理员的身份运行]
如果检测到CUDA,程序将自动选择在GPU上工作。
对于体面的转录,使用不小于medium
模型。
指南如何运行命令行程序:https://www.youtube.com/watch?v=a3nwrcv-btu
香草耳语,按原样编译 - 原始代码没有更改。
参考实现,停滞的开发,ATM可能对某些测试有用。
对电影转录进行了一些默认调整,并使其可移植。
具有各种新的实验设置和调整。
在命令行接口标题栏中显示进度栏。 [或可以用-pp
打印]
默认情况下,它在同一文件夹中查找模型,在这样的路径中 - > _modelsfaster-whisper-medium
。
模型是自动下载或可以手动下载的:Systran&Purfview
弃用。使用更快的Whisper-XXL
包括所有独立的旋转功能 +其他独立功能,例如:
带有MDX23的预处理音频KIM_VOCAL_V2人声提取模型。
替代VAD方法:“ silero_v3','silero_v4','pyannote_v3','pyannote_onnx_v3','auditok','webrtc'。
扬声器诊断。
在讨论线程中阅读有关新功能的更多信息。