openai_whisper_transcribe_yt_videos
1.0.0
该项目是一个基于 Streamlit 的应用程序,允许用户从 YouTube 视频下载音频,使用 OpenAI 的 Whisper 模型转录它们,并使用分页显示转录内容。
查看应用程序的演示:OpenAI Whisper Transcribe YouTube 视频
克隆此存储库:
git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos
安装所需的软件包:
pip install -r requirements.txt
如果您的系统上尚未安装 FFmpeg,请安装它。安装方法因操作系统而异。
运行 Streamlit 应用程序:
streamlit run .srcapp.py
在提供的输入字段中输入 YouTube 视频 URL。
该应用程序将下载音频,转录它,并显示分页转录。
下载音频: download_audio
函数使用 yt-dlp 从提供的 YouTube URL 下载音频。它将音频保存为 WAV 文件。
转录音频: transcribe_audio
函数使用 OpenAI 的 Whisper 模型来转录下载的音频文件。
显示转录本: display_transcript_with_pagination
函数将转录本拆分为多个页面,并使用 Streamlit 的 UI 组件显示它们。
处理音频: process_audio
函数协调整个过程,从下载到转录并显示结果。
transcribe_audio
函数中的model_name
参数来更改 Whisper 模型大小。display_transcript_with_pagination
中的tokens_per_page
参数以更改每页显示的文本量。 此应用程序需要大量的计算资源,特别是对于较长的视频。使用支持 CUDA 的 GPU 可以显着加快转录过程。
麻省理工学院许可证