Vosk est une boîte à outils de reconnaissance vocale open source hors ligne. Il permet la reconnaissance vocale de plus de 20 langues et dialectes : anglais, anglais indien, allemand, français, espagnol, portugais, chinois, russe, turc, vietnamien, italien, néerlandais, catalan, arabe, grec, farsi, philippin, ukrainien, kazakh, Suédois, japonais, espéranto, hindi, tchèque, polonais. Plus à venir.
Les modèles Vosk sont petits (50 Mo) mais offrent une transcription continue d'un large vocabulaire, une réponse sans latence avec l'API de streaming, un vocabulaire reconfigurable et une identification du locuteur.
Liaisons de reconnaissance vocale implémentées pour divers langages de programmation tels que Python, Java, Node.JS, C#, C++, Rust, Go et autres.
Vosk fournit une reconnaissance vocale pour les chatbots, les appareils électroménagers intelligents et les assistants virtuels. Il peut également créer des sous-titres pour des films, des transcriptions pour des conférences et des interviews.
Vosk évolue depuis les petits appareils comme le Raspberry Pi ou le smartphone Android jusqu'aux grands clusters.
Pour obtenir des instructions d'installation, des exemples et de la documentation, visitez le site Web Vosk.