Eksekusi mandiri dari Openai's Whisper & lebih cepat-whisper bagi mereka yang tidak ingin repot dengan Python.
Eksekusi yang lebih cepat whisper kompatibel dengan Windows 7, Linux V5.4, MacOS V10.15 dan di atasnya.
Eksekusi yang lebih cepat WHISPER-XXL kompatibel dengan Windows 7, Linux v5.4 dan di atasnya.
WHISPER EXECECABLABLE kompatibel dengan Windows 7 dan di atasnya.
Dimaksudkan untuk digunakan dalam antarmuka baris perintah atau dalam program seperti Subtitle Edit, Tero Subtitler, Ffastrans, AviUtl.
Lebih cepat-whisper jauh lebih cepat & lebih baik daripada bisikan Openai, dan membutuhkan lebih sedikit RAM/VRAM.
faster-whisper-xxl.exe "D:videofile.mkv" --language English --model medium --output_dir source
faster-whisper-xxl.exe "D:Folder" -l en -m turbo --sentence --batch_recursive
faster-whisper-xxl.exe "D:videofile.mkv" -l ja -m medium --task translate --standard -o source
faster-whisper-xxl.exe --help
Executables & Libs dapat diunduh dari Releases
. [Di sisi kanan halaman ini]
Jangan menyalin program ke folder Windows! [Jalankan sebagai administrator jika Anda melakukannya]
Program secara otomatis akan memilih untuk bekerja di GPU jika CUDA terdeteksi.
Untuk penggunaan transkripsi yang layak tidak lebih kecil dari model medium
.
Panduan Cara Menjalankan Program Baris Perintah: https://www.youtube.com/watch?v=A3NWRCV-BTU
Vanilla Whisper, dikompilasi sebagaimana adanya - tidak ada perubahan pada kode asli.
Implementasi referensi, pengembangan stagnan, ATM mungkin berguna untuk beberapa tes.
Beberapa default di -tweak untuk transkripsi film dan membuatnya portabel.
Fitur berbagai pengaturan eksperimental dan tweak baru.
Menampilkan bilah kemajuan di bilah judul antarmuka baris perintah. [Atau dapat dicetak dengan -pp
]
Secara default ia mencari model di folder yang sama, di jalur seperti ini-> _modelsfaster-whisper-medium
.
Model diunduh secara otomatis atau dapat diunduh secara manual dari: Systran & Purfview
Tercerahkan. Gunakan lebih cepat-whisper-xxl
Termasuk semua fitur mandiri lebih cepat-whisper + yang tambahan, misalnya:
Audio Preprocess dengan MDX23 KIM_VOCAL_V2 Model Ekstraksi Vokal.
Metode VAD alternatif: 'silero_v3', 'silero_v4', 'pyannote_v3', 'pyannote_onnx_v3', 'auditok', 'webrtc'.
Diarisasi pembicara.
Baca lebih lanjut tentang fitur baru di utas diskusi.