AI生成された転写字幕は、人工知能を使用してビデオからオーディオを転写することにより、ビデオに字幕を自動的に追加する方法です。これにより、手動の転写の必要性がなくなり、より多くの視聴者が動画をよりアクセスしやすくすることができます。 Decipherはささやきを使用して、ビデオから撮影したオーディオを転写し、字幕を作成します
Whisperは、Webから収集された680,000時間の多言語およびマルチタスク監視データでトレーニングされたOpenaiの最先端の音声認識システムです。この大きくて多様なデータセットは、アクセント、バックグラウンドノイズ、および専門言語に対する堅牢性の向上につながります。
設定に応じて、Decipherの使用を開始する2つの異なる方法があります。
Google Colab
Manual
注:
Google Colabは、自分の強力なGPUを必要とせずに、機械学習とデータサイエンス用のクラウドベースのプラットフォームです。サーバーで強力なGPU(Tesla K80、T4、P4、またはP100)をセッションあたり最大12時間無料で借りるオプションを提供します。さらに強力なGPUとより長い障害を必要とする人には、Colab Pro/Pro+オプションが利用可能です。
Python
ffmpeg
pip install git+https://github.com/dsymbol/decipher
または
git clone https://github.com/dsymbol/decipher
cd decipher && pip install .
注:「PIPインストールDecipher」を使用しないでください。別のパッケージをインストールします。
decipher gui
# or
python -m decipher gui
transcribe
Subcommandを使用すると、ビデオファイルをSubrip Subtitle(SRT)ファイルに転写できます。また、生成された字幕をビデオに自動的に追加するオプションもあります。
subtitle
サブコマンドを使用すると、既存のSRTファイルを使用してビデオに字幕を追加できます。このサブコマンドは転写を実行しませんが、SRTファイルがすでに作成されていると想定しています。通常、転写サブコマンドによって生成された転写の精度を検証したい人によって使用されます。
すぐに始めるには:
decipher --help
スクリプトが機能しないために実行する場合、パッケージとしてDecipipherを実行できます。
python -m decipher --help
ビデオ用のSRT字幕を生成します。
decipher transcribe -i video.mp4 --model small
生成された字幕をビデオに燃やす:
decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn
転写を検証せずに字幕を生成してビデオに燃やします。
decipher transcribe -i video.mp4 --model small --subtitle_action burn