Pythonを気にしたくない人のためのOpenaiのささやきとより速いウィスパーのスタンドアロン実行可能ファイル。
より速いウィスパー実行可能ファイルは、Windows 7、Linux V5.4、MacOS V10.15以上と互換性があるX86-64です。
より速いWhisper-XXL実行可能ファイルは、X86-64、Windows 7、Linux V5.4以降と互換性があります。
Whisper実行可能ファイルは、Windows 7以降と互換性があるX86-64です。
コマンドラインインターフェイスまたは字幕編集、Tero Subtitler、Ffastrans、Aviutlなどのプログラムで使用することを意味します。
より速いウィスパーは、Openaiのささやきよりもはるかに高速で優れており、RAM/VRAMが少なくなります。
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
実行可能ファイルとLIBSはReleases
からダウンロードできます。 [このページの右側]
Windowsのフォルダーにプログラムをコピーしないでください! [もしそうなら管理者として実行]
CUDAが検出された場合、プログラムはGPUで動作することを自動的に選択します。
まともな転写の場合、 medium
モデルよりも小さくない。
コマンドラインプログラムの実行方法:https://www.youtube.com/watch?v=a3nwrcv-btu
バニラのささやき、そのままコンパイルされた - 元のコードに変更はありません。
参照実装、開発の停滞、ATMは、いくつかのテストに役立つ可能性があります。
いくつかのデフォルトは、映画の転写やポータブルにするために微調整されています。
さまざまな新しい実験設定と微調整を備えています。
コマンドラインインターフェイスのタイトルバーの進行状況バーを示しています。 [または-pp
で印刷することができます]
デフォルトでは、同じフォルダーのモデルを探します_modelsfaster-whisper-medium
モデルは自動的にダウンロードされるか、systran&purfviewから手動でダウンロードできます
非推奨。より速いWhisper-XXLを使用します
たとえば、すべてのスタンドアロンのより速いウィスパー機能 +追加の機能が含まれています。
MDX23 kim_vocal_v2ボーカル抽出モデルを使用したプリプロセスオーディオ。
代替VADメソッド: 'Silero_v3'、 'Silero_v4'、 'pyannote_v3'、 'pyannote_onnx_v3'、 'auditok'、 'webrtc'。
スピーカーダイアリゼーション。
ディスカッションのスレッドで新機能の詳細を読んでください。