Este projeto é um aplicativo baseado em Streamlit que permite aos usuários baixar áudio de vídeos do YouTube, transcrevê-los usando o modelo Whisper da OpenAI e exibir as transcrições com paginação.
Confira a demonstração do aplicativo: OpenAI Whisper Transcribe YouTube Videos
Clone este repositório:
git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos
Instale os pacotes necessários:
pip install -r requirements.txt
Instale o FFmpeg se ainda não estiver no seu sistema. Os métodos de instalação variam de acordo com o sistema operacional.
Execute o aplicativo Streamlit:
streamlit run .srcapp.py
Insira um URL de vídeo do YouTube no campo de entrada fornecido.
O aplicativo irá baixar o áudio, transcrevê-lo e exibir a transcrição com paginação.
Baixar áudio : a função download_audio
usa yt-dlp para baixar o áudio do URL fornecido do YouTube. Ele salva o áudio como um arquivo WAV.
Transcrever áudio : a função transcribe_audio
usa o modelo Whisper da OpenAI para transcrever o arquivo de áudio baixado.
Exibir transcrição : a função display_transcript_with_pagination
divide a transcrição em páginas e as exibe usando os componentes de IU do Streamlit.
Processar áudio : A função process_audio
orquestra todo o processo, desde o download até a transcrição e exibição do resultado.
model_name
na função transcribe_audio
.tokens_per_page
em display_transcript_with_pagination
para alterar a quantidade de texto exibido por página. Esta aplicação requer uma quantidade significativa de recursos computacionais, principalmente para vídeos mais longos. Usar uma GPU habilitada para CUDA pode acelerar significativamente o processo de transcrição.
Licença MIT