Python을 귀찮게하고 싶지 않은 사람들을위한 Openai의 Whisper & Faster-Whisper의 독립형 실행 파일.
더 빠른 whisper 실행 파일은 X86-64 Windows 7, Linux v5.4, MacOS V10.15 이상과 호환됩니다.
더 빠른 whisper-xxl 실행 파일은 X86-64 Windows 7, Linux v5.4 이상과 호환됩니다.
Whisper Executables는 X86-64 Windows 7 이상과 호환됩니다.
명령 줄 인터페이스 또는 자막 편집, Tero Subtitler, Ffastrans, Aviutl과 같은 프로그램에서 사용됩니다.
더 빠른-whisper는 Openai의 속삭임보다 훨씬 빠르고 낫고 RAM/VRAM이 적습니다.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
executables & libs는 Releases
에서 다운로드 할 수 있습니다. [이 페이지의 오른쪽에]
Windows 폴더에 프로그램을 복사하지 마십시오! [그렇다면 관리자로 실행]
CUDA가 감지되면 프로그램은 자동으로 GPU 작업을 선택합니다.
괜찮은 전사 사용의 경우 medium
모델보다 작지 않습니다.
명령 줄 프로그램을 실행하는 방법 : https://www.youtube.com/watch?v=a3nwrcv-btu
바닐라 속삭임은 그대로 편집되어 있습니다 - 원래 코드는 변경되지 않습니다.
참조 구현, 정체 된 개발, ATM은 일부 테스트에 유용 할 수 있습니다.
일부 기본값은 영화 전사와 휴대용으로 조정됩니다.
다양한 새로운 실험 설정 및 조정이 특징입니다.
명령 줄 인터페이스의 제목 표시 줄에 진행률 표시 줄이 표시됩니다. [또는 -pp
로 인쇄 할 수 있습니다]
기본적으로 동일한 폴더에서 모델 _modelsfaster-whisper-medium
찾습니다.
모델을 자동으로 다운로드하거나 수동으로 다운로드 할 수 있습니다 : Systran & Purfview
더 이상 사용되지 않았습니다. 더 빠른-whisper-xxl을 사용하십시오
예를 들어 모든 독립형 독립형 whisper 기능 + 추가 기능이 포함되어 있습니다.
MDX23 KIM_VOCAL_V2 보컬 추출 모델을 사용한 전처리 오디오.
대체 VAD 방법 : 'silero_v3', 'silero_v4', 'pyannote_v3', 'pyannote_onnx_v3', 'Auditok', 'webrtc'.
스피커 발기.
토론 스레드에서 새로운 기능에 대해 자세히 알아보십시오.