Vosk adalah perangkat pengenalan suara sumber terbuka offline. Ini memungkinkan pengenalan ucapan untuk 20+ bahasa dan dialek - Inggris, Inggris India, Jerman, Prancis, Spanyol, Portugis, China, Rusia, Turki, Vietnam, Italia, Belanda, Katalan, Arab, Yunani, Farsi, Filipina, Ukraina, Kazakh, Swedia, Jepang, Esperanto, Hindi, Ceko, Polandia. Masih banyak lagi yang akan datang.
Model Vosk berukuran kecil (50 Mb) tetapi menyediakan transkripsi kosakata besar yang berkelanjutan, respons latensi nol dengan API streaming, kosakata yang dapat dikonfigurasi ulang, dan identifikasi pembicara.
Pengikatan pengenalan ucapan diimplementasikan untuk berbagai bahasa pemrograman seperti Python, Java, Node.JS, C#, C++, Rust, Go, dan lainnya.
Vosk memasok pengenalan suara untuk chatbot, peralatan rumah pintar, asisten virtual. Itu juga dapat membuat subtitle untuk film, transkripsi untuk ceramah dan wawancara.
Skala Vosk mulai dari perangkat kecil seperti Raspberry Pi atau smartphone Android hingga cluster besar.
Untuk petunjuk instalasi, contoh dan dokumentasi, kunjungi Situs Web Vosk.