openai_whisper_transcribe_yt_videos
1.0.0
該專案是一個基於 Streamlit 的應用程序,允許用戶從 YouTube 視頻下載音頻,使用 OpenAI 的 Whisper 模型轉錄它們,並使用分頁顯示轉錄內容。
查看應用程式的演示:OpenAI Whisper Transcribe YouTube 視頻
克隆此存儲庫:
git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos
安裝所需的軟體包:
pip install -r requirements.txt
如果您的系統上尚未安裝 FFmpeg,請安裝它。安裝方法因作業系統而異。
運行 Streamlit 應用程式:
streamlit run .srcapp.py
在提供的輸入欄位中輸入 YouTube 影片 URL。
該應用程式將下載音頻,轉錄它,並顯示分頁轉錄。
下載音訊: download_audio
函數使用 yt-dlp 從提供的 YouTube URL 下載音訊。它將音訊保存為 WAV 檔案。
轉錄音訊: transcribe_audio
函數使用 OpenAI 的 Whisper 模型來轉錄下載的音訊檔案。
顯示轉錄物: display_transcript_with_pagination
函數將轉錄本拆分為多個頁面,並使用 Streamlit 的 UI 元件顯示它們。
處理音訊: process_audio
函數協調整個過程,從下載到轉錄並顯示結果。
transcribe_audio
函數中的model_name
參數來變更 Whisper 模型大小。display_transcript_with_pagination
中的tokens_per_page
參數以變更每頁顯示的文字量。 此應用程式需要大量的運算資源,特別是對於較長的影片。使用支援 CUDA 的 GPU 可以顯著加快轉錄過程。
麻省理工學院許可證