openai_whisper_transcribe_yt_videosダウンロード - openai_whisper_transcribe_yt_videosソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

openai_whisper_transcribe_yt_videos

AI ソースコード

1.0.0

ダウンロード

YouTube ビデオトランスクライバー

このプロジェクトは、ユーザーが YouTube ビデオからオーディオをダウンロードし、OpenAI の Whisper モデルを使用して文字起こしし、ページネーション付きで文字起こしを表示できる Streamlit ベースのアプリケーションです。

特徴

YouTube 動画から音声をダウンロード
OpenAI の Whisper モデルを使用して音声を文字に起こす
ページネーション付きで文字起こしを表示する
互換性のためにファイル名をサニタイズする
CUDA アクセラレーションのサポート (利用可能な場合)

デモ

アプリケーションのデモをチェックしてください: OpenAI Whisper Transcribe YouTube Videos

要件

Python 3.9以降
パイトーチ
yt-dlp
ささやき声
ティックトークン
流光に照らされた
FFmpeg (音声変換用)

インストール

このリポジトリのクローンを作成します。

 git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos

必要なパッケージをインストールします。
```
 pip install -r requirements.txt
```
FFmpeg がシステムにまだインストールされていない場合は、インストールします。インストール方法はオペレーティングシステムによって異なります。

使用法

Streamlit アプリを実行します。
```
 streamlit run .srcapp.py
```
表示された入力フィールドに YouTube ビデオの URL を入力します。
アプリは音声をダウンロードして文字起こしし、ページネーション付きで文字起こしを表示します。

仕組み

オーディオのダウンロード: download_audio関数は、yt-dlp を使用して、指定された YouTube URL からオーディオをダウンロードします。音声を WAV ファイルとして保存します。
オーディオの転写: transcribe_audio関数は、OpenAI の Whisper モデルを使用して、ダウンロードされたオーディオファイルを転写します。
トランスクリプトの表示: display_transcript_with_pagination関数は、トランスクリプトをページに分割し、Streamlit の UI コンポーネントを使用して表示します。
Process Audio : process_audio関数は、ダウンロードから文字起こし、結果の表示までのプロセス全体を調整します。

カスタマイズ

Whisper モデルのサイズを変更するには、 transcribe_audio関数のmodel_nameパラメーターを変更します。
display_transcript_with_paginationのtokens_per_pageパラメーターを調整して、ページごとに表示されるテキストの量を変更します。

注記

このアプリケーションは、特に長いビデオの場合、大量の計算リソースを必要とします。 CUDA 対応 GPU を使用すると、文字起こしプロセスを大幅に高速化できます。

ライセンス

MITライセンス

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2024-12-25
サイズ 70.31MB
から Github

関連アプリ

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
犬キツネバニー

2022-08-01
Lihua データ分析エンジン無料版 3.0_検索_ナビゲーション_コレクション_世論_ランキング_api

2022-06-28

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
node telegram bot api

AI ソースコード

v0.50.0
typebot.io

AI ソースコード

v3.1.2
python wechaty getting started

AI ソースコード

1.0.0
waymo open dataset

その他のソースコード

December 2023 Update
termwind

その他のカテゴリー

v2.3.0
wp functions

その他のカテゴリー

1.0.0

関連情報すべて