Transkripsikan, rangkum, dan buat klip cerdas dari konten video dan audio.
Transkripsi : Transkripsikan audio menggunakan WhisperX
Peringkasan Cerdas : Hasilkan ringkasan singkat konten video, yang disesuaikan dengan berbagai tujuan:
Risalah Rapat
Ringkasan Podcast
Catatan Kuliah
Sorotan Wawancara
Ringkasan Konten Umum
Pembuatan Klip Cerdas : Secara otomatis membuat klip momen dan topik penting yang dibahas dalam video.
Dukungan Multi-format : Memproses berbagai format file video dan audio.
Integrasi Cloud : Memanfaatkan AWS S3 untuk penanganan dan pemrosesan file yang efisien.
Python 3.8+
AWS CLI dikonfigurasi dengan izin yang sesuai
FFmpeg diinstal pada sistem Anda
Node.js dan npm (untuk menjalankan GUI frontend)
Kloning repositori:
git clone https://github.com/sidedwards/ai-video-summarizer.git cd ai-video-summarizer
Siapkan bagian belakang:
Salin config/config-example.yaml
ke config/config.yaml
Edit config/config.yaml
dengan kunci API dan preferensi Anda
Membuat dan mengaktifkan lingkungan virtual:
python -m venv .venv source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
Instal dependensi yang diperlukan:
pip install -r requirements.txt
Siapkan konfigurasi Anda:
Siapkan frontend (opsional, untuk penggunaan GUI):
Arahkan ke direktori frontend:
cd frontend
Instal dependensi yang diperlukan:
npm install
Jalankan skrip CLI:
python backend/cli.py
Ikuti petunjuk untuk memilih file video dan pilih jenis ringkasan yang ingin Anda buat.
File ringkasan yang dihasilkan akan disimpan dalam direktori yang diberi nama sesuai file video masukan.
Mulai server backend:
Jalankan server backend:
python backend/server.py
Mulai server pengembangan frontend:
Di jendela terminal baru, navigasikan ke direktori frontend:
cd frontend
Jalankan server pengembangan frontend:
npm run dev
Buka browser web Anda dan navigasikan ke http://localhost:5173
untuk mengakses AI Video Summarizer GUI.
Gunakan antarmuka web untuk mengunggah file video, pilih jenis ringkasan yang diinginkan, dan mulai pemrosesan.
Setelah pemrosesan selesai, Anda dapat mengunduh file ringkasan yang dihasilkan sebagai arsip zip.
Edit config/config.yaml
untuk mengatur:
Jalur AWS CLI dan nama bucket S3
Replikasi kunci API dan versi model
Kunci API antropik dan pilihan model
Parameter lain yang dapat disesuaikan
GUI berbasis web
CLI dasar
Opsi LLM lainnya
Opsi ekspor untuk berbagai format dokumen (PDF, DOCX, dll.)
Kontribusi dipersilahkan! Silakan kirimkan Permintaan Tarik.
Lisensi MIT
Proyek ini menggunakan WhisperX, versi lanjutan dari model Whisper OpenAI, untuk transkripsi. Penawaran WhisperX:
Transkripsi yang dipercepat
Diarisasi pembicara tingkat lanjut
Peningkatan akurasi dalam segmentasi speaker
Model WhisperX dijalankan melalui Replikasi API, berdasarkan https://github.com/sidewards/whisperx.