sherpa
adalah kerangka kerja inferensi teks-ucapan sumber terbuka menggunakan PyTorch, dengan fokus eksklusif pada model end-to-end (E2E), yaitu model berbasis transduser dan CTC. Ini menyediakan API C++ dan Python.
Proyek ini berfokus pada penerapan, yaitu menggunakan model terlatih untuk menyalin ucapan. Jika Anda tertarik pada cara melatih atau menyempurnakan model Anda sendiri, silakan merujuk ke icefall.
Kami juga memiliki proyek serupa lainnya yang tidak bergantung pada PyTorch:
sherpa-onnx
dansherpa-ncnn
juga mendukung iOS, Android, dan sistem tertanam.
Silakan merujuk ke dokumentasi di https://k2-fsa.github.io/sherpa/
Coba sherpa
dari dalam browser Anda tanpa menginstal apa pun: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition