Proyek ini adalah aplikasi berbasis Streamlit yang memungkinkan pengguna mengunduh audio dari video YouTube, mentranskripsikannya menggunakan model Whisper OpenAI, dan menampilkan transkripsi dengan penomoran halaman.
Lihat demo aplikasinya: OpenAI Whisper Transkripsikan Video YouTube
Kloning repositori ini:
git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos
Instal paket yang diperlukan:
pip install -r requirements.txt
Instal FFmpeg jika belum ada di sistem Anda. Metode instalasi berbeda-beda tergantung sistem operasi.
Jalankan aplikasi Streamlit:
streamlit run .srcapp.py
Masukkan URL video YouTube di kolom input yang tersedia.
Aplikasi akan mengunduh audio, mentranskripsikannya, dan menampilkan transkripsi dengan penomoran halaman.
Unduh Audio : Fungsi download_audio
menggunakan yt-dlp untuk mengunduh audio dari URL YouTube yang disediakan. Ini menyimpan audio sebagai file WAV.
Transkripsikan Audio : Fungsi transcribe_audio
menggunakan model Whisper OpenAI untuk mentranskripsikan file audio yang diunduh.
Transkrip Tampilan : Fungsi display_transcript_with_pagination
membagi transkrip menjadi beberapa halaman dan menampilkannya menggunakan komponen UI Streamlit.
Proses Audio : Fungsi process_audio
mengatur seluruh proses, mulai dari pengunduhan hingga transkripsi dan menampilkan hasilnya.
model_name
di fungsi transcribe_audio
.tokens_per_page
di display_transcript_with_pagination
untuk mengubah jumlah teks yang ditampilkan per halaman. Aplikasi ini membutuhkan sumber daya komputasi yang besar, terutama untuk video berdurasi panjang. Menggunakan GPU berkemampuan CUDA dapat mempercepat proses transkripsi secara signifikan.
Lisensi MIT