? Saya sedang mengerjakan penulisan ulang proyek secara lengkap. Kemajuan dalam hal ini dapat dilihat di cabang v4. Akibatnya, cabang ini tidak akan menerima rilis atau pembaruan baru apa pun.
whishper adalah rangkaian transkripsi dan subtitle audio lokal 100% open-source dengan UI web berfitur lengkap.
Fitur
Transkripsikan media apa pun ke teks: audio, video, dll.
Transkripsikan dari URL (sumber apa pun yang didukung oleh yt-dlp).
Unggah file untuk ditranskripsi.
? Unduh transkripsi dalam berbagai format : TXT, JSON, VTT, SRT atau salin teks mentah ke clipboard Anda.
Terjemahkan transkripsi Anda ke bahasa apa pun yang didukung oleh Libretranslate.
✍️ Editor subtitle yang kuat sehingga Anda tidak perlu keluar dari UI!
Penyorotan transkripsi berdasarkan posisi media.
Peringatan CPS (Karakter per detik).
Pemisahan segmen.
Penyisipan segmen.
Pemilihan bahasa subtitle.
? 100% Lokal : transkripsi, terjemahan, dan edisi subtitle terjadi 100% di mesin Anda (bahkan dapat bekerja secara offline!).
Cepat : menggunakan FasterWhisper sebagai backend Whisper: dapatkan waktu transkripsi yang lebih cepat di CPU!
? Penyiapan cepat dan mudah : gunakan skrip mulai cepat, atau jalankan beberapa langkah!
Dukungan GPU : gunakan GPU NVIDIA Anda untuk mendapatkan waktu transkripsi yang lebih cepat!
? Dukungan CPU : tidak ada GPU? Tidak masalah! whishper dapat berjalan di CPU juga.
Peta jalan
Folder lokal sebagai media input (#15).
Pencarian teks lengkap semua transkripsi.
Otentikasi pengguna.
Rekaman audio dari browser.
Tambahkan bisikan yang sangat cepat sebagai backend opsional (#53).
Dukungan untuk akselerasi GPU.
Dukungan GPU non NVIDIA. Apakah mungkin dengan bisikan yang lebih cepat?
Bisakah kita melakukan sesuatu dengan komunikasi_yang lancar?
Struktur proyek
whishper adalah kumpulan potongan-potongan yang bekerja sama. Tiga bagian utama adalah:
Transcription-API: Ini adalah API yang memungkinkan menjalankan Faster-Whisper. Anda dapat menemukannya di folder transcription-api .
whishper -Backend: Ini adalah backend yang mengoordinasikan panggilan frontend, database, dan tugas. Anda dapat menemukannya di folder backend .
whishper -Frontend: Ini adalah frontend (UI web) aplikasi. Anda dapat menemukannya di folder frontend .
Terjemahan (pihak ketiga): Ini adalah wadah libretranslate yang digunakan untuk menerjemahkan subtitle.
MongoDB (pihak ketiga): Ini adalah database yang menyimpan semua informasi tentang transkripsi Anda.
Nginx (pihak ketiga): Ini adalah proxy yang memungkinkan menjalankan semuanya dari satu domain.
Berkontribusi
Kontribusi dipersilahkan! Jangan ragu untuk membuka PR dengan perubahan Anda, atau lihat masalahnya untuk melihat apakah ada sesuatu yang dapat Anda bantu.
Pengaturan pengembangan
Lihat dokumentasi pengembangan di sini.
Tangkapan layar
Tangkapan layar ini tersedia di situs web resmi, klik salah satu tautan berikut untuk melihat: