Python を使って誰でもいたずら/面白いように聞こえます。
文字起こしモデル (ここでは Whisper) を利用して音声を文字起こしし、MP4 から選択したキーワードをブリープアウトし、選択した単語に関連付けられた抽出されたタイムスタンプを使用して、選択した単語をターゲットにしてブリープ音に置き換えます。
すべての処理はローカルで実行されます。
バージョン全体の比較
例
インストール
ウォークスルー
最終製品の例 (デフォルトではボリュームがオフになっているので、必ずボリュームをオンにしてください)。
上記の最後の例を詳しく見てみましょう。以下は、このリポジトリでパイプラインを使用する際のいくつかの単語を吹き出す短いクリップです。 (必ずオーディオをオンにしてください - デフォルトではオフになっています)
すると、「トリーツ」、「アイス」、「クリーム」、「チョコレート」、「シロップ」、「クッキー」という言葉が含まれた同じクリップが流れ出ました。
ノートブックを実行するためのセットアップを取得するには、独自のビデオを鳴らし、strealit デモを実行します。まず、以下をターミナルに貼り付けて、このプロジェクトの要件をインストールします。
pip install - r requirements . streamlit
Gradio デモの要件をインストールするには、このインストールを使用してください
pip install - r requirements . gradio
ffmpeg もマシンにインストールする必要があります。
このストリームライト デモをローカルで開始すると、音を鳴らしたい動画の YouTube / ショート URL を入力できます。
python - m streamlit run bleep_that_sht / app_url_download . py
あるいは、同じ機能を備えた gradio サーバーを起動することもできます
python - m bleep_that_sht / gradio_app_url_download . py
docker compose を使用することもできます
docker compose up
詳細を再生/確認するには、 beep_that_sht_walkthrough.ipynb
を参照してください。